Método de conteo en DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos sobre el método count() de la clase DataFrame de Pandas. El método count() se utiliza para contar el número de valores no nulos en un DataFrame, ya sea para cada columna o para cada fila.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos el problema para usted de inmediato.

Importar las bibliotecas necesarias

Primero, importemos las bibliotecas necesarias para este laboratorio:

import pandas as pd
import numpy as np

Crear un DataFrame

A continuación, creemos un DataFrame que usaremos para los ejemplos de este laboratorio. Nuestro DataFrame tendrá información sobre estudiantes, como sus nombres, números de matrícula, materias y calificaciones.

df = pd.DataFrame([
    ['Abhishek', '101', 'Science', 90],
    ['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Contar los valores no nulos para cada columna

Para contar el número de valores no nulos para cada columna en el DataFrame, podemos usar el método count() sin ningún parámetro. Esto devolverá un objeto Series donde el índice representa los nombres de las columnas y los valores representan el recuento de valores no nulos en cada columna.

column_counts = df.count()
print(column_counts)

Salida:

Name       2
Roll No    2
Subject    1
Marks      2
dtype: int64

Contar los valores no nulos para cada fila

Para contar el número de valores no nulos para cada fila en el DataFrame, podemos usar el método count() con el parámetro axis establecido en 1. Esto devolverá un objeto Series donde el índice representa los números de fila y los valores representan el recuento de valores no nulos en cada fila.

row_counts = df.count(axis=1)
print(row_counts)

Salida:

0    4
1    3
dtype: int64

Contar los valores numéricos no nulos para cada fila

Si queremos contar solo los valores numéricos no nulos para cada fila, podemos usar el método count() con el parámetro numeric_only establecido en True. Esto contará solo las columnas con tipos de datos numéricos (float, int) y excluirá las columnas con tipos de datos no numéricos (object).

numeric_counts = df.count(numeric_only=True)
print(numeric_counts)

Salida:

Roll No    2
Marks      2
dtype: int64

Resumen

¡Felicidades! Has completado con éxito este laboratorio sobre el método count() del DataFrame de Pandas. En este laboratorio, aprendiste cómo contar el número de valores no nulos en un DataFrame para cada columna o fila utilizando el método count(). También aprendiste cómo contar solo los valores numéricos no nulos utilizando el parámetro numeric_only. Sigue practicando y explorando diferentes métodos de la biblioteca de Pandas para ser más hábil en el análisis y manipulación de datos con Python. ¡Que disfrutes programando!