Méthode DataFrame.convert_dtypes() de Pandas

Beginner

Introduction

La méthode DataFrame.convert_dtypes() dans Pandas de Python est utilisée pour convertir les colonnes d'un DataFrame en les meilleurs types de données possibles. Elle est particulièrement utile lorsqu'il s'agit de colonnes de DataFrame contenant des types de données mixtes ou lorsque nous souhaitons optimiser l'utilisation de la mémoire en stockant les données dans les types de données les plus appropriés.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques nécessaires et créer un DataFrame

Tout d'abord, nous devons importer la bibliothèque pandas, qui fournit la classe DataFrame et la méthode convert_dtypes(). Ensuite, nous pouvons créer un DataFrame avec des colonnes de différents types de données.

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

Vérifier les types de données actuels du DataFrame

Pour voir les types de données actuels des colonnes d'un DataFrame, nous pouvons utiliser l'attribut dtypes.

print("Types de données actuels :")
print(df.dtypes)

Convertir les colonnes du DataFrame en les meilleurs types de données possibles

Pour convertir les colonnes d'un DataFrame en les meilleurs types de données possibles, nous pouvons utiliser la méthode convert_dtypes(). Par défaut, elle essaie de convertir les types de données objets en les types les plus appropriés, tels que StringDtype pour les colonnes objets contenant des chaînes de caractères et BooleanDtype pour les colonnes objets contenant des valeurs booléennes.

df_converted = df.convert_dtypes()

Vérifier les types de données après la conversion

Nous pouvons maintenant vérifier les types de données des colonnes du DataFrame après la conversion.

print("Types de données après conversion :")
print(df_converted.dtypes)

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.convert_dtypes() en Python Pandas pour convertir les colonnes d'un DataFrame en les meilleurs types de données possibles. Cette méthode est utile lorsqu'il s'agit de traiter des types de données mixtes dans les colonnes ou d'optimiser l'utilisation de la mémoire. En convertissant les colonnes en les types de données les plus appropriés, nous pouvons améliorer l'efficacité de l'analyse et de la manipulation des données.