Méthode asof() du DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, vous allez découvrir la méthode asof() de la bibliothèque Pandas de Python. La méthode asof() est utilisée pour récupérer la dernière ligne ou les dernières lignes sans valeurs NaN avant une date ou une position d'index spécifiée dans un DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") python/DataStructuresGroup -.-> python/lists("Lists") pandas/DataCleaningGroup -.-> pandas/handle_missing_values("Handling Missing Values") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/AdvancedOperationsGroup -.-> pandas/time_series_analysis("Time Series Analysis") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/select_columns -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} pandas/select_rows -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} python/lists -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} pandas/handle_missing_values -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} python/using_packages -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} pandas/time_series_analysis -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} python/data_collections -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} python/data_serialization -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} python/data_analysis -.-> lab-68585{{"Méthode asof() du DataFrame Pandas"}} end

Créer un DataFrame

Tout d'abord, créons un DataFrame avec quelques valeurs manquantes (NaN) à des fins de démonstration. Nous utiliserons la fonction pd.DataFrame() de la bibliothèque Pandas.

import pandas as pd
import numpy as np

data = {'A': [1, 2, np.nan, 4],
        'B': [np.nan, 2, np.nan, 5.0]}
index = [10, 20, 30, 40]

df = pd.DataFrame(data, index=index)
print(df)

Le DataFrame df sera affiché, montrant les valeurs et les étiquettes d'index.

Récupérer les dernières lignes à l'aide de asof()

Maintenant, utilisons la méthode asof() pour récupérer les dernières lignes du DataFrame avant une date ou une position d'index spécifiée. Nous passerons la date ou la position d'index en tant que paramètre à la méthode asof().

dates = [5, 20]
asof_result = df.asof(dates)
print(asof_result)

Le résultat de la méthode asof() sera affiché, montrant les dernières lignes avant les dates spécifiées.

Considérez un sous-ensemble de colonnes

Nous pouvons également spécifier un sous-ensemble de colonnes à considérer lors de la vérification des valeurs NaN. Cela se fait en passant les noms de colonnes sous forme de liste au paramètre subset de la méthode asof().

dates = [10, 30]
subset = ['A']
asof_result_subset = df.asof(dates, subset=subset)
print(asof_result_subset)

Le résultat de la méthode asof() avec un sous-ensemble de colonnes sera affiché, montrant les dernières lignes avant les dates spécifiées et en considérant seulement les colonnes spécifiées.

Sommaire

Dans ce laboratoire, vous avez appris à connaître la méthode asof() dans Pandas. Vous avez appris à utiliser cette méthode pour récupérer la dernière ligne ou les dernières lignes sans valeurs NaN avant une date ou une position d'index spécifiée dans un DataFrame. Vous avez également appris à spécifier un sous-ensemble de colonnes à considérer lors de la vérification des valeurs NaN. Cela peut être utile pour analyser des données temporelles ou travailler avec des valeurs manquantes dans un DataFrame.