Méthode de réindexation d'un DataFrame Pandas

PandasPandasBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce tutoriel, nous allons apprendre à utiliser la méthode DataFrame.reindex() de la bibliothèque Python pandas. Nous explorerons comment modifier l'index et les colonnes d'un DataFrame en utilisant cette méthode. La méthode DataFrame.reindex() nous permet de synchroniser le DataFrame avec un nouvel index en remplissant les valeurs nulles aux emplacements qui n'avaient pas de valeur dans l'ancien index.

Conseils pour la machine virtuelle (VM)

Une fois que la machine virtuelle a démarré, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook et accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes que Jupyter Notebook termine de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes lors de votre apprentissage, n'hésitez pas à poser vos questions à Labby. Donnez votre avis après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") python/DataStructuresGroup -.-> python/lists("Lists") pandas/DataCleaningGroup -.-> pandas/handle_missing_values("Handling Missing Values") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/select_columns -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} pandas/select_rows -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} python/lists -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} pandas/handle_missing_values -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} python/importing_modules -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} pandas/reshape_data -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} python/data_collections -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} python/data_serialization -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} python/data_analysis -.-> lab-68713{{"Méthode de réindexation d'un DataFrame Pandas"}} end

Importer la bibliothèque pandas et créer un DataFrame

Commençons par importer la bibliothèque pandas et créer un DataFrame. Nous utiliserons ce DataFrame pour démontrer la méthode DataFrame.reindex().

import pandas as pd

## Create a DataFrame
df = pd.DataFrame([[1, 6, 2], [3, 4, 6], [12, 1, 0]], columns=['A', 'B', 'C'], index=['index_1', 'index_2', 'index_3'])

Réindexer le DataFrame en utilisant le paramètre index

Pour réindexer le DataFrame en changeant l'index, passez une liste de nouveaux étiquettes d'index à la méthode DataFrame.reindex(). Toutes les étiquettes d'index qui ne sont pas présentes dans le DataFrame original seront remplies avec des valeurs NaN.

## Reindex the DataFrame with a new index
new_index = ['index_1', 'index_2', 'index_4']
reindexed_df = df.reindex(index=new_index)

print(reindexed_df)

Sortie :

         A    B    C
index_1  1.0  6.0  2.0
index_2  3.0  4.0  6.0
index_4  NaN  NaN  NaN

Réindexer le DataFrame en utilisant le paramètre columns

De même, vous pouvez réindexer le DataFrame en changeant les colonnes en utilisant la méthode DataFrame.reindex(). Fournissez une liste de nouvelles étiquettes de colonnes au paramètre columns. Toutes les colonnes qui ne sont pas présentes dans le DataFrame original seront remplies avec des valeurs NaN.

## Reindex the DataFrame with new columns
new_columns = ['A', 'C', 'D']
reindexed_df = df.reindex(columns=new_columns)

print(reindexed_df)

Sortie :

         A    C    D
index_1  1.0  2.0  NaN
index_2  3.0  6.0  NaN
index_3  12.0  0.0  NaN

Remplir les valeurs nulles en utilisant le paramètre fill_value

Si vous souhaitez remplir les valeurs nulles avec une valeur spécifique, vous pouvez utiliser le paramètre fill_value de la méthode DataFrame.reindex(). Fournissez la valeur souhaitée pour remplir les valeurs nulles.

## Reindex the DataFrame and fill null values with 2
new_index = ['index_1', 'index_2', 'index_4']
reindexed_df = df.reindex(index=new_index, fill_value=2)

print(reindexed_df)

Sortie :

         A  B  C
index_1  1  6  2
index_2  3  4  6
index_4  2  2  2

Résumé

Dans ce tutoriel, nous avons appris à réindexer un DataFrame en utilisant la méthode DataFrame.reindex() de pandas. Nous avons exploré comment changer l'index et les colonnes d'un DataFrame, remplir les valeurs nulles et spécifier une valeur de remplissage pour les valeurs nulles. Savoir réindexer correctement un DataFrame est utile pour manipuler et aligner les données dans pandas.