Méthode de filtrage des DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode filter() dans un DataFrame Pandas. La méthode filter() nous permet de sélectionner un sous - ensemble de lignes ou de colonnes d'un DataFrame en fonction des étiquettes d'index spécifiées. Il est important de noter que cette méthode filtre le DataFrame en fonction des étiquettes de l'index, et non du contenu du DataFrame.

Conseils pour la machine virtuelle (VM)

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook afin d'accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut - être attendre quelques secondes que Jupyter Notebook ait terminé de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant votre apprentissage, n'hésitez pas à demander de l'aide à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/AdvancedTopicsGroup(["Advanced Topics"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") pandas/DataSelectionGroup -.-> pandas/slicing("Slicing") python/DataStructuresGroup -.-> python/lists("Lists") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") python/AdvancedTopicsGroup -.-> python/regular_expressions("Regular Expressions") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/select_columns -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} pandas/select_rows -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} pandas/slicing -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} python/lists -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} python/using_packages -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} python/regular_expressions -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} python/data_collections -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} python/data_serialization -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} python/data_analysis -.-> lab-68622{{"Méthode de filtrage des DataFrame Pandas"}} end

Créer un DataFrame

Tout d'abord, créons un DataFrame d'exemple avec lequel travailler.

#import pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({
    "Name":["Navya","Vindya","Sinchana","Amrutha","Akshatha"],
    "Age":[25,24,25,25,26],
    "Education":["M.Tech","M.Tech","M.Tech","Ph.d","Ph.d"],
    "YOP":[2019,2020,2018,None,None]},
    index=["Group_1", "Group_1","Group_1","Group_2","Group_2"])

#printing DataFrame
print("-------DataFrame is----------")
print(df)

Filtrer par noms de colonnes en utilisant la méthode filter()

Nous pouvons utiliser le paramètre items de la méthode filter() pour filtrer le DataFrame par certaines colonnes.

#filter by column names
filtered_df = df.filter(items=["Name","Education"])

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Filtrer par noms de lignes en utilisant la méthode filter()

Nous pouvons utiliser le paramètre like de la méthode filter() pour filtrer le DataFrame par certaines lignes.

#filter by row names
filtered_df = df.filter(like='Group_2', axis=0)

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Filtrer par noms de colonnes avec le paramètre regex

Nous pouvons utiliser le paramètre regex de la méthode filter() pour filtrer le DataFrame par certaines colonnes en fonction d'une expression régulière.

#filter by column names with regex
filtered_df = df.filter(regex ='[g]')

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Résumé

Dans ce laboratoire (lab), nous avons appris à utiliser la méthode filter() dans un DataFrame Pandas. Nous avons vu comment filtrer le DataFrame par noms de colonnes et de lignes, ainsi que comment filtrer en fonction d'une expression régulière. Cette méthode est utile pour extraire un sous - ensemble du DataFrame en fonction d'étiquettes d'index spécifiques.