Método head() em DataFrames Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método head() na biblioteca Python pandas para obter as primeiras n linhas de um DataFrame. Este método é comumente usado para inspecionar rapidamente os dados em um DataFrame e entender sua estrutura.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca pandas

Primeiramente, precisamos importar a biblioteca pandas usando a instrução import.

import pandas as pd

Criar um DataFrame

Em seguida, criaremos um objeto DataFrame que contém alguns dados de exemplo. Por exemplo, vamos criar um DataFrame com uma única coluna "Language" que contém uma lista de linguagens de programação.

## Create the DataFrame
df = pd.DataFrame({'Language': ['Kannada','Hindi', 'Telugu', 'Tamil', 'Malyalam','Marathi','Konkani','Tulu']})

Usar o método head()

Para obter as primeiras n linhas do DataFrame, podemos usar o método head(). Por padrão, ele retorna as primeiras 5 linhas. Aqui está um exemplo:

print("----First 5 rows of the DataFrame is-----")
print(df.head())

Especificar o número de linhas

Também podemos especificar o número de linhas que queremos recuperar passando um parâmetro para o método head(). Isso nos permite obter um número específico de linhas do início do DataFrame. Por exemplo, para obter as primeiras 2 linhas, podemos usar o seguinte código:

print("----First 2 rows of the DataFrame is-----")
print(df.head(n=2))

Usar um valor negativo para n

Se passarmos um valor negativo para n para o método head(), ele retornará todas as linhas, exceto as últimas n linhas. Isso é equivalente a usar a notação de slicing df[:-n]. Aqui está um exemplo:

print("----First n rows of the DataFrame is-----")
print(df.head(-2))

Resumo

Neste laboratório, aprendemos como usar o método head() na biblioteca pandas para recuperar as primeiras n linhas de um DataFrame. Este método é útil para inspecionar rapidamente os dados e entender sua estrutura. Ao especificar o número de linhas, podemos recuperar um subconjunto específico do DataFrame. Adicionalmente, usar um valor negativo para n nos permite recuperar todas as linhas, exceto as últimas n linhas. No geral, o método head() é uma ferramenta útil para explorar o conteúdo de um DataFrame.