Méthode hist() pour les DataFrame Pandas

Beginner

Introduction

La méthode hist() de la bibliothèque Pandas nous permet de créer des histogrammes, qui sont des représentations visuelles de la distribution des données. Cette méthode est utilisée sur un objet DataFrame et appelle la fonction matplotlib.pyplot.hist() sur chaque série du DataFrame, ce qui résulte en un histogramme par colonne.

Conseils sur la VM

Une fois le démarrage de la VM terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.

Importer les bibliothèques nécessaires

Pour utiliser la méthode hist(), nous devons importer les bibliothèques requises, qui sont pandas et matplotlib.pyplot.

import pandas as pd
import matplotlib.pyplot as plt

Créer un DataFrame

Ensuite, nous devons créer un objet DataFrame à l'aide de la méthode pd.DataFrame(). Nous pouvons passer un dictionnaire en argument, où les clés représentent les noms des colonnes et les valeurs représentent les données.

data = {'length': [1.5, 0.5, 1.2, 0.9, 3], 'width': [0.7, 0.2, 0.15, 0.2, 1.1]}
df = pd.DataFrame(data)

Créer un histogramme

Maintenant, nous pouvons utiliser la méthode hist() sur le DataFrame pour créer un histogramme de chaque colonne.

df.hist()
plt.show()

Personnaliser l'histogramme

Nous pouvons personnaliser l'histogramme en fournissant des paramètres supplémentaires à la méthode hist(). Par exemple, nous pouvons spécifier le nombre de barres, la couleur des barres de l'histogramme et le titre de l'histogramme.

df.hist(bins=10, color='skyblue')
plt.title('Histogram')
plt.show()

Résumé

La méthode hist() dans Pandas nous permet de créer des histogrammes des données contenues dans un DataFrame. En utilisant cette méthode, nous pouvons visualiser la distribution de nos données, ce qui peut être utile pour l'analyse et l'exploration des données. De plus, nous pouvons personnaliser l'apparence de l'histogramme en fournissant des paramètres supplémentaires à la méthode hist(). Dans l'ensemble, la méthode hist() est un outil pratique pour analyser et visualiser des données dans Pandas.