Pandas DataFrame Nsmallest-Methode

Einführung

Die Python Pandas DataFrame.nsmallest()-Methode wird verwendet, um die ersten n Zeilen eines DataFrames zu erhalten, die nach Spalten in aufsteigender Reihenfolge sortiert sind. Diese Methode gibt die ersten n Zeilen mit den kleinsten Werten in den angegebenen Spalten in aufsteigender Reihenfolge zurück. Die nicht angegebenen Spalten werden ebenfalls zurückgegeben, werden jedoch nicht zur Sortierung verwendet.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importiere die Pandas-Bibliothek

Zunächst müssen wir die Pandas-Bibliothek mit dem import-Statement importieren.

import pandas as pd

Erstelle das DataFrame

Als nächstes müssen wir ein DataFrame erstellen, mit dem wir arbeiten können. Wir können die pd.DataFrame()-Funktion verwenden, um ein DataFrame aus einem Dictionary zu erstellen.

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age':  [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})

Verwende die nsmallest()-Methode

Jetzt können wir die nsmallest()-Methode auf dem DataFrame verwenden, um die ersten n Zeilen mit den kleinsten Werten in den angegebenen Spalten abzurufen.

df.nsmallest(n, columns, keep='first')

Die Methode nimmt drei Parameter:

n: Die Anzahl der Zeilen, die zurückgegeben werden sollen.
columns: Das Label oder die Liste von Labels, die den Namen der Spalten angeben, nach denen sortiert werden soll.
keep: Enthält 'first', 'last', 'all' und der Standardwert ist 'first'.
- 'first': Gebe bei Duplikaten die erste Vorkommen priorität.
- 'last': Gebe bei Duplikaten das letzte Vorkommen priorität.
- 'all': Entferne keine Duplikate, auch wenn dies bedeutet, dass mehr als n Elemente ausgewählt werden.

Zeige die Ergebnisse an

Schließlich können wir das resultierende DataFrame ausgeben, um die ersten n Zeilen mit den kleinsten Werten in den angegebenen Spalten zu sehen.

print(df.nsmallest(n, columns, keep='first'))

Zusammenfassung

Die DataFrame.nsmallest()-Methode in der Python-Bibliothek Pandas ist ein bequemer Weg, um die ersten n Zeilen mit den kleinsten Werten in bestimmten Spalten eines DataFrames abzurufen. Mit dieser Methode können wir leicht die Datensätze finden und anzeigen, die unseren Kriterien entsprechen.