Méthode first du DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode DataFrame.first() dans Pandas. La méthode DataFrame.first() sélectionne les périodes initiales de données de séries temporelles sur la base d'un décalage de date. Cela peut être utile lorsqu'on travaille avec un DataFrame dont l'index est constitué de dates et qu'on veut sélectionner les premières lignes sur la base d'un décalage de date spécifique.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.

Importez les bibliothèques nécessaires

Tout d'abord, nous devons importer la bibliothèque pandas, que nous utiliserons pour travailler avec le DataFrame.

import pandas as pd

Créez un DataFrame avec des dates comme index

Ensuite, créons un DataFrame avec des dates comme index. Nous utiliserons la fonction pd.date_range() pour générer une plage de dates et la fonction pd.DataFrame() pour créer le DataFrame.

i = pd.date_range('2021-01-01', periods=5, freq='D')
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]}, index=i)

Utilisez la méthode DataFrame.first() pour sélectionner les premières lignes

Maintenant, nous pouvons utiliser la méthode DataFrame.first() pour sélectionner les premières lignes sur la base d'un décalage de date spécifique. Par exemple, si nous voulons sélectionner les 3 premiers jours, nous pouvons utiliser le code suivant :

df_first = df.first('3D')

Affichez les lignes sélectionnées

Enfin, affichons les lignes sélectionnées du DataFrame.

print(df_first)

Récapitulatif

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.first() dans Pandas pour sélectionner les périodes initiales de données de séries temporelles sur la base d'un décalage de date. Cela peut être utile lorsqu'on travaille avec un DataFrame qui a des dates comme index et qu'on veut sélectionner les premières lignes sur la base d'un décalage de date spécifique. En suivant les étapes de ce laboratoire, vous devriez maintenant être capable d'utiliser la méthode DataFrame.first() dans vos propres tâches d'analyse de données.