Méthode astype() pour les DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode astype() dans la bibliothèque Pandas de Python. La méthode astype() nous permet de convertir le type de données d'un DataFrame Pandas en un type spécifié. Nous pouvons convertir les types de données de toutes les colonnes ou de colonnes spécifiques dans le DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.

Convertir tous les types de données des colonnes d'un DataFrame

Nous pouvons utiliser la méthode astype() pour convertir les types de données de toutes les colonnes d'un DataFrame en un type spécifié. Voici un exemple :

import pandas as pd

## Créer un DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Avant de convertir le type de données du DataFrame-----")
print(df.dtypes)

## Convertir les types de données de toutes les colonnes en int32
df = df.astype('int32')

print("----Après avoir converti le type de données du DataFrame-----")
print(df.dtypes)

Sortie :

----Avant de convertir le type de données du DataFrame-----
A int64
B int64
dtype: object

----Après avoir converti le type de données du DataFrame-----
A int32
B int32
dtype: object

Dans cet exemple, nous créons un DataFrame avec deux colonnes A et B. Avant de convertir les types de données, les deux colonnes ont le type de données int64. Après avoir utilisé la méthode astype() avec l'argument 'int32', les deux colonnes sont converties en type de données int32.

Convertir le type de données d'une colonne spécifique d'un DataFrame

Nous pouvons également utiliser la méthode astype() pour convertir le type de données d'une colonne spécifique dans un DataFrame. Voici un exemple :

import pandas as pd

## Créer un DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Avant de convertir le type de données du DataFrame-----")
print(df.dtypes)

## Convertir le type de données de la colonne 'A' en int32
df['A'] = df['A'].astype('int32')

print("----Après avoir converti le type de données d'une colonne unique du DataFrame-----")
print(df.dtypes)

Sortie :

----Avant de convertir le type de données du DataFrame-----
A int64
B int64
dtype: object

----Après avoir converti le type de données d'une colonne unique du DataFrame-----
A int32
B int64
dtype: object

Dans cet exemple, nous créons un DataFrame avec deux colonnes A et B. Avant de convertir le type de données, la colonne A a le type de données int64 et la colonne B a le type de données int64. Après avoir utilisé la méthode astype() avec l'argument 'int32' sur la colonne A, seul le type de données de la colonne A est converti en int32, tandis que le type de données de la colonne B reste int64.

Vérification du DataFrame converti

Après avoir converti les types de données d'un DataFrame, nous pouvons vérifier le DataFrame mis à jour pour vérifier si les conversions ont été réussies. Voici un exemple :

import pandas as pd

## Créer un DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Après avoir converti le type de données d'une colonne unique du DataFrame-----")
df['B'] = df['B'].astype('float')
print(df.dtypes)
print("-----DataFrame après conversion en types de données flottants-----")
print(df)

Sortie :

----Après avoir converti le type de données d'une colonne unique du DataFrame-----
A int64
B float64
dtype: object

-----DataFrame après conversion en types de données flottants-----
   A     B
0  1   6.0
1  2   7.0
2  3   8.0
3  4   9.0
4  5  10.0

Dans cet exemple, nous créons un DataFrame avec deux colonnes A et B. Après avoir utilisé la méthode astype() avec l'argument 'float' sur la colonne B, le type de données de la colonne B est converti en float64. Nous imprimons ensuite les types de données du DataFrame pour confirmer les modifications, et imprimons le DataFrame lui-même pour voir les valeurs mises à jour.

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode astype() dans Pandas pour convertir les types de données d'un DataFrame. Nous avons vu comment convertir tous les types de données des colonnes et les types de données de colonnes spécifiques à l'aide de la méthode astype(), et avons également vérifié le DataFrame résultant après les conversions. La méthode astype() est utile pour manipuler et transformer les données dans un DataFrame Pandas.