Introdução
O método DataFrame.nsmallest() do Pandas em Python é usado para obter as primeiras n linhas de um DataFrame que estão ordenadas por colunas em ordem ascendente. Este método retorna as primeiras n linhas com os menores valores nas colunas especificadas, em ordem ascendente. As colunas que não são especificadas também são retornadas, mas não são usadas para a ordenação.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar a biblioteca Pandas
Primeiramente, precisamos importar a biblioteca Pandas usando a instrução import.
import pandas as pd
Criar o DataFrame
Em seguida, precisamos criar um DataFrame para trabalhar. Podemos usar a função pd.DataFrame() para criar um DataFrame a partir de um dicionário.
df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age': [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})
Usar o método nsmallest()
Agora, podemos usar o método nsmallest() no DataFrame para recuperar as primeiras n linhas com os menores valores nas colunas especificadas.
df.nsmallest(n, columns, keep='first')
O método recebe três parâmetros:
n: O número de linhas a serem retornadas.columns: O rótulo ou lista de rótulos que especificam o nome das colunas para ordenar.keep: Inclui ‘first’, ‘last’, ‘all’, e o padrão é ‘first’.'first': prioriza a(s) primeira(s) ocorrência(s) em caso de valores duplicados.'last': prioriza a(s) última(s) ocorrência(s) em caso de valores duplicados.'all': não remove quaisquer duplicatas, mesmo que isso signifique selecionar mais de n itens.
Exibir os resultados
Finalmente, podemos imprimir o DataFrame resultante para ver as primeiras n linhas com os menores valores nas colunas especificadas.
print(df.nsmallest(n, columns, keep='first'))
Resumo
O método DataFrame.nsmallest() em Python Pandas é uma maneira conveniente de recuperar as primeiras n linhas com os menores valores em colunas especificadas de um DataFrame. Ao usar este método, podemos facilmente encontrar e exibir os registros que atendem aos nossos critérios.