Introduction
La méthode DataFrame.convert_dtypes() dans Pandas de Python est utilisée pour convertir les colonnes d'un DataFrame en les meilleurs types de données possibles. Elle est particulièrement utile lorsqu'il s'agit de colonnes de DataFrame contenant des types de données mixtes ou lorsque nous souhaitons optimiser l'utilisation de la mémoire en stockant les données dans les types de données les plus appropriés.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.
Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Importer les bibliothèques nécessaires et créer un DataFrame
Tout d'abord, nous devons importer la bibliothèque pandas, qui fournit la classe DataFrame et la méthode convert_dtypes(). Ensuite, nous pouvons créer un DataFrame avec des colonnes de différents types de données.
import pandas as pd
df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})
Vérifier les types de données actuels du DataFrame
Pour voir les types de données actuels des colonnes d'un DataFrame, nous pouvons utiliser l'attribut dtypes.
print("Types de données actuels :")
print(df.dtypes)
Convertir les colonnes du DataFrame en les meilleurs types de données possibles
Pour convertir les colonnes d'un DataFrame en les meilleurs types de données possibles, nous pouvons utiliser la méthode convert_dtypes(). Par défaut, elle essaie de convertir les types de données objets en les types les plus appropriés, tels que StringDtype pour les colonnes objets contenant des chaînes de caractères et BooleanDtype pour les colonnes objets contenant des valeurs booléennes.
df_converted = df.convert_dtypes()
Vérifier les types de données après la conversion
Nous pouvons maintenant vérifier les types de données des colonnes du DataFrame après la conversion.
print("Types de données après conversion :")
print(df_converted.dtypes)
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.convert_dtypes() en Python Pandas pour convertir les colonnes d'un DataFrame en les meilleurs types de données possibles. Cette méthode est utile lorsqu'il s'agit de traiter des types de données mixtes dans les colonnes ou d'optimiser l'utilisation de la mémoire. En convertissant les colonnes en les types de données les plus appropriés, nous pouvons améliorer l'efficacité de l'analyse et de la manipulation des données.