Pandas DataFrame Filter-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie man die filter()-Methode in einem Pandas DataFrame verwendet. Die filter()-Methode ermöglicht es uns, Zeilen oder Spalten eines DataFrames anhand von angegebenen Indexlabels auszuwählen. Es ist wichtig zu beachten, dass diese Methode den DataFrame anhand der Labels des Index filtert, nicht anhand des Inhalts des DataFrames.

Tipps für die virtuelle Maschine (VM)

Nachdem die VM gestartet wurde, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und auf Jupyter Notebook für die Übung zuzugreifen.

Manchmal müssen Sie möglicherweise einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie sich gerne an Labby wenden. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie umgehend beheben.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/AdvancedTopicsGroup(["Advanced Topics"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") pandas/DataSelectionGroup -.-> pandas/slicing("Slicing") python/DataStructuresGroup -.-> python/lists("Lists") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") python/AdvancedTopicsGroup -.-> python/regular_expressions("Regular Expressions") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/select_columns -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} pandas/select_rows -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} pandas/slicing -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} python/lists -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} python/using_packages -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} python/regular_expressions -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} python/data_collections -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} python/data_serialization -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} python/data_analysis -.-> lab-68622{{"Pandas DataFrame Filter-Methode"}} end

Erstellen eines DataFrames

Zuerst erstellen wir einen Beispiel-DataFrame, mit dem wir arbeiten können.

#import pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({
    "Name":["Navya","Vindya","Sinchana","Amrutha","Akshatha"],
    "Age":[25,24,25,25,26],
    "Education":["M.Tech","M.Tech","M.Tech","Ph.d","Ph.d"],
    "YOP":[2019,2020,2018,None,None]},
    index=["Group_1", "Group_1","Group_1","Group_2","Group_2"])

#printing DataFrame
print("-------DataFrame is----------")
print(df)

Filtern nach Spaltennamen mit der filter()-Methode

Wir können den items-Parameter der filter()-Methode verwenden, um den DataFrame nach bestimmten Spalten zu filtern.

#filter by column names
filtered_df = df.filter(items=["Name","Education"])

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Filtern nach Zeilennamen mit der filter()-Methode

Wir können den like-Parameter der filter()-Methode verwenden, um den DataFrame nach bestimmten Zeilen zu filtern.

#filter by row names
filtered_df = df.filter(like='Group_2', axis=0)

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Filtern nach Spaltennamen mit dem regex-Parameter

Wir können den regex-Parameter der filter()-Methode verwenden, um den DataFrame nach bestimmten Spalten anhand eines regulären Ausdrucks zu filtern.

#filter by column names with regex
filtered_df = df.filter(regex ='[g]')

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die filter()-Methode im Pandas DataFrame verwendet. Wir haben behandelt, wie man den DataFrame nach Spaltennamen und Zeilennamen filtert, sowie wie man anhand eines regulären Ausdrucks filtert. Diese Methode ist nützlich, um den DataFrame anhand spezifischer Indexbezeichnungen (index labels) zu unterteilen.