Pandas DataFrame Nsmallest: Guia Completo

Introdução

O método DataFrame.nsmallest() do Pandas em Python é usado para obter as primeiras n linhas de um DataFrame que estão ordenadas por colunas em ordem ascendente. Este método retorna as primeiras n linhas com os menores valores nas colunas especificadas, em ordem ascendente. As colunas que não são especificadas também são retornadas, mas não são usadas para a ordenação.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca Pandas

Primeiramente, precisamos importar a biblioteca Pandas usando a instrução import.

import pandas as pd

Criar o DataFrame

Em seguida, precisamos criar um DataFrame para trabalhar. Podemos usar a função pd.DataFrame() para criar um DataFrame a partir de um dicionário.

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age':  [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})

Usar o método nsmallest()

Agora, podemos usar o método nsmallest() no DataFrame para recuperar as primeiras n linhas com os menores valores nas colunas especificadas.

df.nsmallest(n, columns, keep='first')

O método recebe três parâmetros:

n: O número de linhas a serem retornadas.
columns: O rótulo ou lista de rótulos que especificam o nome das colunas para ordenar.
keep: Inclui ‘first’, ‘last’, ‘all’, e o padrão é ‘first’.
- 'first': prioriza a(s) primeira(s) ocorrência(s) em caso de valores duplicados.
- 'last': prioriza a(s) última(s) ocorrência(s) em caso de valores duplicados.
- 'all': não remove quaisquer duplicatas, mesmo que isso signifique selecionar mais de n itens.

Exibir os resultados

Finalmente, podemos imprimir o DataFrame resultante para ver as primeiras n linhas com os menores valores nas colunas especificadas.

print(df.nsmallest(n, columns, keep='first'))

Resumo

O método DataFrame.nsmallest() em Python Pandas é uma maneira conveniente de recuperar as primeiras n linhas com os menores valores em colunas especificadas de um DataFrame. Ao usar este método, podemos facilmente encontrar e exibir os registros que atendem aos nossos critérios.

Método Nsmallest do DataFrame Pandas