Método DataFrame.convert_dtypes() de Pandas

PandasPandasBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

El método DataFrame.convert_dtypes() de Pandas en Python se utiliza para convertir las columnas de un DataFrame a los tipos de datos más adecuados posibles. Es especialmente útil cuando se tratan columnas de DataFrame que contienen tipos de datos mixtos o cuando queremos optimizar el uso de memoria al almacenar datos en los tipos de datos más adecuados.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/BasicConceptsGroup(["Basic Concepts"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) pandas(("Pandas")) -.-> pandas/DataManipulationGroup(["Data Manipulation"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python/BasicConceptsGroup -.-> python/variables_data_types("Variables and Data Types") python/BasicConceptsGroup -.-> python/type_conversion("Type Conversion") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") pandas/DataManipulationGroup -.-> pandas/change_data_types("Changing Data Types") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills python/variables_data_types -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} python/type_conversion -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} pandas/select_columns -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} pandas/select_rows -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} pandas/change_data_types -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} python/importing_modules -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} python/data_collections -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} python/data_analysis -.-> lab-68597{{"Método DataFrame.convert_dtypes() de Pandas"}} end

Importar las bibliotecas necesarias y crear un DataFrame

Primero, necesitamos importar la biblioteca pandas, que proporciona la clase DataFrame y el método convert_dtypes(). Luego, podemos crear un DataFrame con columnas de diferentes tipos de datos.

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

Verificar los tipos de datos actuales del DataFrame

Para ver los tipos de datos actuales de las columnas del DataFrame, podemos usar el atributo dtypes.

print("Tipos de datos actuales:")
print(df.dtypes)

Convertir las columnas del DataFrame a los tipos de datos más adecuados posibles

Para convertir las columnas del DataFrame a los tipos de datos más adecuados posibles, podemos usar el método convert_dtypes(). Por defecto, intenta convertir los tipos de datos de objeto a los tipos más adecuados, como StringDtype para las columnas de objeto que contienen cadenas y BooleanDtype para las columnas de objeto que contienen valores booleanos.

df_converted = df.convert_dtypes()

Verificar los tipos de datos después de la conversión

Ahora podemos verificar los tipos de datos de las columnas del DataFrame después de la conversión.

print("Tipos de datos después de la conversión:")
print(df_converted.dtypes)

Resumen

En este laboratorio, aprendimos cómo usar el método DataFrame.convert_dtypes() en Python Pandas para convertir las columnas de un DataFrame a los tipos de datos más adecuados posibles. Este método es útil cuando se tratan con tipos de datos mixtos en las columnas o cuando se desea optimizar el uso de memoria. Al convertir las columnas a los tipos de datos más adecuados, podemos mejorar la eficiencia del análisis y manipulación de datos.