Méthode nsmallest du DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

La méthode DataFrame.nsmallest() de Python Pandas est utilisée pour obtenir les premières n lignes d'un DataFrame triées par colonnes dans l'ordre croissant. Cette méthode renvoie les premières n lignes avec les plus petites valeurs dans les colonnes spécifiées, dans l'ordre croissant. Les colonnes qui ne sont pas spécifiées sont également renvoyées, mais ne sont pas utilisées pour le tri.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet d'étude pour accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque Pandas

Tout d'abord, nous devons importer la bibliothèque Pandas à l'aide de l'instruction import.

import pandas as pd

Créez le DataFrame

Ensuite, nous devons créer un DataFrame avec lequel travailler. Nous pouvons utiliser la fonction pd.DataFrame() pour créer un DataFrame à partir d'un dictionnaire.

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age':  [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})

Utilisez la méthode nsmallest()

Maintenant, nous pouvons utiliser la méthode nsmallest() sur le DataFrame pour récupérer les premières n lignes avec les plus petites valeurs dans les colonnes spécifiées.

df.nsmallest(n, columns, keep='first')

La méthode prend trois paramètres :

  • n : Le nombre de lignes à renvoyer.
  • columns : L'étiquette ou la liste d'étiquettes qui spécifient le nom des colonnes pour le tri.
  • keep : Il inclut 'first', 'last', 'all' et la valeur par défaut est 'first'.
    • 'first' : privilégie la première occurrence(s) en cas de valeurs dupliquées.
    • 'last' : privilégie la dernière occurrence(s) en cas de valeurs dupliquées.
    • 'all' : ne supprime aucun doublon, même si cela signifie sélectionner plus de n éléments.

Affichez les résultats

Enfin, nous pouvons imprimer le DataFrame résultant pour voir les premières n lignes avec les plus petites valeurs dans les colonnes spécifiées.

print(df.nsmallest(n, columns, keep='first'))

Sommaire

La méthode DataFrame.nsmallest() en Python Pandas est un moyen pratique de récupérer les premières n lignes avec les plus petites valeurs dans les colonnes spécifiées d'un DataFrame. En utilisant cette méthode, nous pouvons facilement trouver et afficher les enregistrements qui répondent à nos critères.