Introduction
Ce laboratoire se concentre sur la compréhension de la manière de configurer et de personnaliser le comportement global lié à l'affichage des DataFrame Pandas, au comportement des données et bien plus encore. Nous explorerons comment obtenir/définir des options, réinitialiser les options à leurs valeurs par défaut et décrire les options. Nous apprendrons également à exécuter un bloc de code avec un ensemble d'options qui reviennent aux paramètres précédents après l'exécution.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session et nous réglerons rapidement le problème pour vous.
Importation de Pandas
Commençons par importer la bibliothèque Pandas. Il s'agit d'une bibliothèque puissante de manipulation de données en Python.
## Importation de la bibliothèque pandas
import pandas as pd
Obtenir et définir des options
Nous pouvons obtenir ou définir la valeur d'une option unique en utilisant respectivement pd.get_option ou pd.set_option. Ici, nous définissons le nombre maximum de lignes à afficher sur 999.
## Obtenez la configuration actuelle pour le nombre maximum de lignes à afficher
print(pd.options.display.max_rows)
## Définissez le nombre maximum de lignes à afficher sur 999
pd.options.display.max_rows = 999
## Vérifiez la nouvelle configuration
print(pd.options.display.max_rows)
Réinitialiser les options
Si nous souhaitons réinitialiser une ou plusieurs options à leur valeur par défaut, nous pouvons utiliser pd.reset_option.
## Réinitialisez le nombre maximum de lignes à afficher à la valeur par défaut
pd.reset_option("display.max_rows")
## Vérifiez la réinitialisation
print(pd.options.display.max_rows)
Décrire les options
Pour afficher les descriptions d'une ou plusieurs options, utilisez pd.describe_option.
## Décrivez l'option 'display.max_rows'
pd.describe_option("display.max_rows")
Utilisation de option_context
La fonction option_context nous permet d'exécuter un bloc de code avec un ensemble d'options qui reviennent aux paramètres précédents après l'exécution.
## Exécutez un bloc de code avec un ensemble d'options
with pd.option_context("display.max_rows", 10):
## Cela affichera 10 malgré que le paramètre global soit différent
print(pd.get_option("display.max_rows"))
## Cela affichera le paramètre global car le bloc de contexte est terminé
print(pd.get_option("display.max_rows"))
Définir les options de démarrage
Nous pouvons créer un script de démarrage dans l'environnement Python/IPython pour importer pandas et définir des options, ce qui rend le travail avec pandas plus efficace.
## Voici un exemple de script de démarrage
## Placez-le dans un fichier.py dans le répertoire de démarrage du profil IPython
import pandas as pd
pd.set_option("display.max_rows", 999)
pd.set_option("display.precision", 5)
Sommaire
Ce guide de laboratoire a expliqué comment obtenir, définir et réinitialiser les options dans pandas. Nous avons également discuté de la manière de décrire les options et d'utiliser la fonction option_context. Enfin, nous avons exploré la façon de définir les options de démarrage dans l'environnement Python/IPython. Ces techniques nous permettent de personnaliser et de configurer le comportement de pandas pour répondre à nos besoins.