Introducción
El método info() de la biblioteca Python Pandas se utiliza para obtener un resumen de un DataFrame. Proporciona información valiosa sobre el DataFrame, incluyendo el tipo de datos del índice y las columnas, los valores no nulos y el uso de memoria.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.
Importar las bibliotecas necesarias
En primer lugar, necesitamos importar la biblioteca pandas, que es una poderosa biblioteca de manipulación de datos en Python.
import pandas as pd
Crear un DataFrame
A continuación, necesitamos crear un DataFrame. Esto se puede hacer utilizando la función pd.DataFrame() y pasando un diccionario de datos.
int_values = [1, 2, 3, 4, 5]
text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
float_values = [0.0, 0.25, 0.5, 0.75, 1.0]
df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values})
Usar el método info()
Ahora que tenemos nuestro DataFrame, podemos utilizar el método info() para obtener la información resumida. Por defecto, el método info() imprime el resumen completo del DataFrame.
df.info()
Analizar la salida
Después de ejecutar el código, verá la información resumida sobre el DataFrame, incluyendo el tipo de datos de cada columna, el número de valores no nulos y el uso de memoria. Aquí hay un ejemplo de salida:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
## Column Non-Null Count Dtype
--- ------ -------------- -----
0 int_col 5 non-null int64
1 text_col 5 non-null object
2 float_col 5 non-null float64
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes
Resumen
El método info() en la biblioteca Python Pandas es un método útil para obtener un resumen rápido de un DataFrame. Proporciona información sobre el tipo de datos del índice y las columnas, los valores no nulos y el uso de memoria. Por defecto, muestra el resumen completo, pero también se pueden modificar los parámetros para personalizar la salida. Este método es útil para entender la estructura del DataFrame, especialmente cuando se tratan conjuntos de datos grandes. Con la información obtenida de info(), se pueden tomar decisiones informadas sobre la limpieza, manipulación y análisis de datos.