Méthode clip() sur DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode clip() de la bibliothèque Pandas pour tronquer des valeurs dans un DataFrame. La méthode clip() nous permet de définir des seuils supérieur et inférieur et d'affecter les valeurs en dehors des limites aux valeurs limites. Cela peut être utile lorsque nous voulons limiter la plage de valeurs dans notre DataFrame.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque pandas et créez un DataFrame

Tout d'abord, importons la bibliothèque pandas et créons un DataFrame.

import pandas as pd

## Créez un dictionnaire avec quelques données d'échantillonnage
data = {'col_1': [9, -3, 0, -1, 12], 'col_2': [-2, -7, -6, 8, -5]}

## Créez un DataFrame à partir du dictionnaire
df = pd.DataFrame(data)

Affichez le DataFrame original

Affichons le DataFrame original pour voir les valeurs avant d'appliquer la méthode clip().

print("------DataFrame--------")
print(df)

Utilisez la méthode clip() avec un seuil supérieur

Maintenant, utilisons la méthode clip() pour tronquer les valeurs à un seuil supérieur. Cela signifie que toutes les valeurs supérieures au seuil supérieur spécifié seront définies sur la valeur du seuil lui-même.

## Tronquez les valeurs à un seuil supérieur de 6
clipped_df = df.clip(upper=6)

print("------Après avoir tronqué le DataFrame--------")
print(clipped_df)

Utilisez la méthode clip() avec un seuil inférieur

Ensuite, utilisons la méthode clip() pour tronquer les valeurs à un seuil inférieur. Cela signifie que toutes les valeurs inférieures au seuil inférieur spécifié seront définies sur la valeur du seuil lui-même.

## Tronquez les valeurs à un seuil inférieur de -1
clipped_df = df.clip(lower=-1)

print("------Après avoir tronqué le DataFrame--------")
print(clipped_df)

Utilisez la méthode clip() avec des seuils supérieur et inférieur

Enfin, utilisons la méthode clip() pour tronquer les valeurs à la fois à un seuil supérieur et à un seuil inférieur. Cela signifie que toutes les valeurs au-dessus du seuil supérieur seront définies sur la valeur du seuil supérieur, et toutes les valeurs en-dessous du seuil inférieur seront définies sur la valeur du seuil inférieur.

## Tronquez les valeurs à un seuil inférieur de -1 et à un seuil supérieur de 6
clipped_df = df.clip(-1, 6)

print("------Après avoir tronqué le DataFrame--------")
print(clipped_df)

Sommaire

Dans ce laboratoire, nous avons appris à utiliser la méthode clip() de la bibliothèque Pandas pour tronquer les valeurs dans un DataFrame. Nous avons vu comment définir des seuils supérieur et inférieur pour limiter la plage de valeurs dans le DataFrame. Cela peut être utile dans les tâches de nettoyage et de traitement des données.