Método Count do Pandas DataFrame

Beginner

Introdução

Neste laboratório, aprenderemos sobre o método count() na classe DataFrame do Pandas. O método count() é usado para contar o número de valores não nulos em um DataFrame, seja para cada coluna ou para cada linha.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Primeiro, vamos importar as bibliotecas necessárias para este laboratório:

import pandas as pd
import numpy as np

Criar um DataFrame

Em seguida, vamos criar um DataFrame que usaremos para os exemplos neste laboratório. Nosso DataFrame terá informações sobre os alunos, como seus nomes, números de matrícula, disciplinas e notas.

df = pd.DataFrame([
    ['Abhishek', '101', 'Science', 90],
    ['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Contar os valores não nulos para cada coluna

Para contar o número de valores não nulos para cada coluna no DataFrame, podemos usar o método count() sem nenhum parâmetro. Isso retornará um objeto Series onde o índice representa os nomes das colunas e os valores representam a contagem de valores não nulos em cada coluna.

column_counts = df.count()
print(column_counts)

Output:

Name       2
Roll No    2
Subject    1
Marks      2
dtype: int64

Contar os valores não nulos para cada linha

Para contar o número de valores não nulos para cada linha no DataFrame, podemos usar o método count() com o parâmetro axis definido como 1. Isso retornará um objeto Series onde o índice representa os números das linhas e os valores representam a contagem de valores não nulos em cada linha.

row_counts = df.count(axis=1)
print(row_counts)

Output:

0    4
1    3
dtype: int64

Contar os valores numéricos não nulos para cada linha

Se quisermos contar apenas os valores numéricos não nulos para cada linha, podemos usar o método count() com o parâmetro numeric_only definido como True. Isso contará apenas as colunas com tipos de dados numéricos (float, int) e excluirá colunas com tipos de dados não numéricos (object).

numeric_counts = df.count(numeric_only=True)
print(numeric_counts)

Output:

Roll No    2
Marks      2
dtype: int64

Resumo

Parabéns! Você concluiu com sucesso este laboratório sobre o método count() do Pandas DataFrame. Neste laboratório, você aprendeu como contar o número de valores não nulos em um DataFrame para cada coluna ou linha usando o método count(). Você também aprendeu como contar apenas os valores numéricos não nulos usando o parâmetro numeric_only. Continue praticando e explorando diferentes métodos da biblioteca Pandas para se tornar mais proficiente em análise e manipulação de dados com Python. Boa codificação!