Méthode head() pour les DataFrame de Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode head() de la bibliothèque Python pandas pour obtenir les premières n lignes d'un DataFrame. Cette méthode est couramment utilisée pour examiner rapidement les données d'un DataFrame et comprendre sa structure.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque pandas

Tout d'abord, nous devons importer la bibliothèque pandas à l'aide de l'instruction import.

import pandas as pd

Créez un DataFrame

Ensuite, nous allons créer un objet DataFrame qui contient quelques données d'échantillonnage. Par exemple, créons un DataFrame avec une seule colonne "Langue" qui contient une liste de langages de programmation.

## Create the DataFrame
df = pd.DataFrame({'Language': ['Kannada','Hindi', 'Telugu', 'Tamil', 'Malyalam','Marathi','Konkani','Tulu']})

Utilisez la méthode head()

Pour obtenir les premières n lignes du DataFrame, nous pouvons utiliser la méthode head(). Par défaut, elle renvoie les premières 5 lignes. Voici un exemple :

print("----Les premières 5 lignes du DataFrame sont-----")
print(df.head())

Spécifiez le nombre de lignes

Nous pouvons également spécifier le nombre de lignes que nous souhaitons récupérer en passant un paramètre à la méthode head(). Cela nous permet d'obtenir un nombre spécifique de lignes depuis le début du DataFrame. Par exemple, pour obtenir les premières 2 lignes, nous pouvons utiliser le code suivant :

print("----Les premières 2 lignes du DataFrame sont-----")
print(df.head(n=2))

Utilisez une valeur négative pour n

Si nous passons une valeur négative pour n à la méthode head(), elle renverra toutes les lignes sauf les dernières n lignes. Cela est équivalent à utiliser la notation de découpage df[:-n]. Voici un exemple :

print("----Les premières n lignes du DataFrame sont-----")
print(df.head(-2))

Récapitulatif

Dans ce laboratoire, nous avons appris à utiliser la méthode head() de la bibliothèque pandas pour récupérer les premières n lignes d'un DataFrame. Cette méthode est pratique pour examiner rapidement les données et comprendre sa structure. En spécifiant le nombre de lignes, nous pouvons récupérer un sous-ensemble spécifique du DataFrame. De plus, en utilisant une valeur négative pour n, nous pouvons récupérer toutes les lignes sauf les dernières n lignes. Dans l'ensemble, la méthode head() est un outil pratique pour explorer le contenu d'un DataFrame.