Introduction
La méthode DataFrame.kurt() dans la bibliothèque Python pandas est utilisée pour calculer l'aplatissement (kurtosis en anglais) d'un DataFrame. L'aplatissement est une mesure statistique qui décrit la forme d'une distribution. Elle permet de déterminer si les données ont des queues lourdes ou légères par rapport à une distribution normale. Une valeur d'aplatissement positive indique une distribution à queues lourdes, tandis qu'une valeur négative indique une distribution à queues légères.
Conseils pour la machine virtuelle (VM)
Une fois que la machine virtuelle a démarré, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook et accéder à Jupyter Notebook pour pratiquer.
Parfois, vous devrez peut-être attendre quelques secondes que Jupyter Notebook ait terminé de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant votre apprentissage, n'hésitez pas à poser vos questions à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Importer les bibliothèques nécessaires
Pour utiliser la méthode DataFrame.kurt(), nous devons d'abord importer la bibliothèque pandas.
import pandas as pd
Créer un DataFrame
Nous allons créer un DataFrame qui contient des données numériques.
df = pd.DataFrame({"A": [55, 60, 74, 50], "B": [30, 55, 40, 47], "C": [12, 55, 44, 66]})
Appliquer la méthode DataFrame.kurt()
Pour calculer l'aplatissement (kurtosis en anglais) du DataFrame, nous pouvons utiliser la méthode DataFrame.kurt(). Par défaut, cette méthode calcule l'aplatissement pour chaque colonne.
kurtosis = df.kurt()
Afficher le résultat
Enfin, nous pouvons afficher les valeurs d'aplatissement (kurtosis en anglais) pour chaque colonne.
print(kurtosis)
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.kurt() dans Python pandas pour calculer l'aplatissement (kurtosis en anglais) d'un DataFrame. En suivant les étapes, nous avons pu importer les bibliothèques nécessaires, créer un DataFrame, appliquer la méthode et afficher le résultat. Les valeurs d'aplatissement donnent des informations sur la forme de la distribution des données et peuvent être utilisées pour l'analyse statistique.