Método nsmallest de DataFrame de Pandas

Beginner

Introducción

El método DataFrame.nsmallest() de Python Pandas se utiliza para obtener las primeras n filas de un DataFrame ordenadas por columnas en orden ascendente. Este método devuelve las primeras n filas con los valores más pequeños en las columnas especificadas, en orden ascendente. Las columnas que no se especifican también se devuelven, pero no se utilizan para la ordenación.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca Pandas

Primero, necesitamos importar la biblioteca Pandas utilizando la declaración import.

import pandas as pd

Crear el DataFrame

A continuación, necesitamos crear un DataFrame con el que trabajar. Podemos utilizar la función pd.DataFrame() para crear un DataFrame a partir de un diccionario.

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age':  [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})

Usar el método nsmallest()

Ahora, podemos utilizar el método nsmallest() en el DataFrame para recuperar las primeras n filas con los valores más pequeños en las columnas especificadas.

df.nsmallest(n, columns, keep='first')

El método toma tres parámetros:

  • n: El número de filas a devolver.
  • columns: La etiqueta o lista de etiquetas que especifican el nombre de las columnas por las que ordenar.
  • keep: Incluye ‘first’, ‘last’, ‘all’ y el valor predeterminado es ‘first’.
    • 'first': prioriza la primera aparición(es) en caso de valores duplicados.
    • 'last': prioriza la última aparición(es) en caso de valores duplicados.
    • 'all': no elimina ningún duplicado, incluso si significa seleccionar más de n elementos.

Mostrar los resultados

Finalmente, podemos imprimir el DataFrame resultante para ver las primeras n filas con los valores más pequeños en las columnas especificadas.

print(df.nsmallest(n, columns, keep='first'))

Resumen

El método DataFrame.nsmallest() en Pandas de Python es una forma conveniente de recuperar las primeras n filas con los valores más pequeños en columnas especificadas de un DataFrame. Al utilizar este método, podemos encontrar y mostrar fácilmente los registros que cumplen con nuestros criterios.