Méthode de jointure de DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode join() de la bibliothèque Python Pandas. La méthode join() est utilisée pour joindre les colonnes d'un autre DataFrame à un DataFrame existant. Elle peut joindre les colonnes sur la base de l'index ou sur une colonne clé.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques requises et créer les DataFrames

    import pandas as pd

    ## Créez le premier DataFrame
    df_1 = pd.DataFrame({"A":[0,1], "B":[3,4]})
    print("Le premier DataFrame:")
    print(df_1)

    ## Créez le second DataFrame
    df_2 = pd.DataFrame({"C":[0,1], "D":[3,4]})
    print("Le second DataFrame:")
    print(df_2)

Joindre les deux DataFrames en utilisant la méthode join()

    print("DataFrame joint:")
    joined_df = df_1.join(df_2)
    print(joined_df)

Joindre les deux DataFrames en utilisant les paramètres lsuffix et rsuffix

    print("DataFrame joint avec des suffixes :")
    joined_df_suffix = df_1.join(df_2, lsuffix='_first', rsuffix='_second')
    print(joined_df_suffix)

Joindre les deux DataFrames en utilisant une colonne spécifique comme clé

    print("DataFrame joint en utilisant A comme clé :")
    joined_df_key = df_1.set_index('A').join(df_2.set_index('A'))
    print(joined_df_key)

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode join() dans la bibliothèque Python Pandas. Nous avons vu comment joindre deux DataFrames sur l'index ou une colonne clé, et comment utiliser des suffixes pour différencier les colonnes en chevauchement. La méthode join() est un outil pratique pour combiner et fusionner des DataFrames dans Pandas.