Método nlargest en el DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, exploraremos el método nlargest() en el DataFrame de Pandas. Este método nos permite recuperar las primeras N filas de un DataFrame basado en una columna o columnas especificadas, ordenadas en orden descendente.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) pandas(("Pandas")) -.-> pandas/DataManipulationGroup(["Data Manipulation"]) pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") python/DataStructuresGroup -.-> python/lists("Lists") pandas/DataManipulationGroup -.-> pandas/sort_data("Sorting Data") pandas/DataCleaningGroup -.-> pandas/remove_duplicates("Removing Duplicates") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills pandas/select_rows -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} python/lists -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} pandas/sort_data -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} pandas/remove_duplicates -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} python/using_packages -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} python/data_collections -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} python/data_analysis -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} python/data_visualization -.-> lab-68678{{"Método nlargest en el DataFrame de Pandas"}} end

Crear un DataFrame

Comencemos creando un DataFrame de ejemplo con el que trabajar. Utilizaremos el siguiente código para crear un DataFrame con columnas para Nombre, Edad, Altura y Peso:

import pandas as pd

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],
                   'Age':[20,25,30,18,25,20],
                   'Height':[155,160,175,145,155,165],
                   'Weight':[75,60,75,45,55,65]})

Este código crea un DataFrame con las columnas y datos especificados.

Utilizar el método nlargest()

El método nlargest() nos permite recuperar las primeras N filas basadas en una columna especificada. La sintaxis para utilizar este método es la siguiente:

df.nlargest(n, columns)
  • n es un entero que especifica el número de filas a devolver.
  • columns es una etiqueta o una lista de etiquetas que representan las columnas por las que se ordenará.

Recuperar las primeras N filas

Utilicemos el método nlargest() para recuperar las primeras 2 filas basadas en la columna 'Height'. Utilizaremos el siguiente código:

top_n_rows = df.nlargest(2, 'Height')
print(top_n_rows)

Este código devolverá un nuevo DataFrame que constará de las primeras 2 filas ordenadas por la columna 'Height'.

Especificar una columna diferente

También podemos utilizar el método nlargest() para recuperar las primeras N filas basadas en una columna diferente. Vamos a recuperar las primeras 3 filas basadas en la columna 'Age' con el siguiente código:

top_n_rows = df.nlargest(3, 'Age')
print(top_n_rows)

Este código devolverá un nuevo DataFrame que constará de las primeras 3 filas ordenadas por la columna 'Age'.

Especificar el parámetro keep

Podemos especificar el parámetro keep para priorizar la primera o última aparición de filas con valores duplicados. Por defecto, keep está establecido en 'first'. Vamos a especificar keep='last' al recuperar las primeras 2 filas basadas en la columna 'Height':

top_n_rows = df.nlargest(2, 'Height', keep='last')
print(top_n_rows)

Este código devolverá un nuevo DataFrame que constará de las últimas 2 filas con los valores más grandes en la columna 'Height'.

Resumen

En este laboratorio, aprendimos cómo utilizar el método nlargest() en el DataFrame de Pandas. Podemos utilizar este método para recuperar las primeras N filas basadas en una o más columnas especificadas, ordenadas en orden descendente. También podemos especificar el parámetro keep para priorizar la primera o última aparición de filas con valores duplicados. Este método es útil para encontrar rápidamente los valores más grandes o altos en un DataFrame basados en criterios específicos.