Метод DataFrame.convert_dtypes() в Pandas

PandasPandasBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Метод DataFrame.convert_dtypes() в Python Pandas используется для преобразования столбцов DataFrame в наилучшие возможные типы данных. Он особенно полезен при работе с столбцами DataFrame, содержащими смешанные типы данных, или когда мы хотим оптимизировать использование памяти, сохраняя данные в наиболее подходящих типах данных.

Советы по работе с ВМ

После завершения запуска ВМ нажмите в верхнем левом углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) pandas(("Pandas")) -.-> pandas/DataManipulationGroup(["Data Manipulation"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python(("Python")) -.-> python/BasicConceptsGroup(["Basic Concepts"]) python/BasicConceptsGroup -.-> python/variables_data_types("Variables and Data Types") python/BasicConceptsGroup -.-> python/type_conversion("Type Conversion") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") pandas/DataManipulationGroup -.-> pandas/change_data_types("Changing Data Types") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills python/variables_data_types -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} python/type_conversion -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} pandas/select_columns -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} pandas/select_rows -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} pandas/change_data_types -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} python/importing_modules -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} python/data_collections -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} python/data_analysis -.-> lab-68597{{"Метод DataFrame.convert_dtypes() в Pandas"}} end

Импортируем необходимые библиотеки и создаем DataFrame

Сначала нам нужно импортировать библиотеку pandas, которая предоставляет класс DataFrame и метод convert_dtypes(). Затем мы можем создать DataFrame с столбцами различных типов данных.

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

Проверить текущие типы данных DataFrame

Для просмотра текущих типов данных столбцов DataFrame мы можем использовать атрибут dtypes.

print("Current data types:")
print(df.dtypes)

Преобразовать столбцы DataFrame в наилучшие возможные типы данных

Для преобразования столбцов DataFrame в наилучшие возможные типы данных мы можем использовать метод convert_dtypes(). По умолчанию он пытается преобразовать объекты данных в наиболее подходящие типы, например, StringDtype для столбцов объектов, содержащих строки, и BooleanDtype для столбцов объектов, содержащих булевы значения.

df_converted = df.convert_dtypes()

Проверить типы данных после преобразования

Теперь мы можем проверить типы данных столбцов DataFrame после преобразования.

print("Data types after conversion:")
print(df_converted.dtypes)

Резюме

В этом практическом занятии мы узнали, как использовать метод DataFrame.convert_dtypes() в Python Pandas для преобразования столбцов DataFrame в наилучшие возможные типы данных. Этот метод полезен при работе с смешанными типами данных в столбцах или при оптимизации использования памяти. Преобразованием столбцов в наиболее подходящие типы данных мы можем повысить эффективность анализа и обработки данных.