Introduction
Dans ce laboratoire, nous allons apprendre à utiliser la méthode max() dans un DataFrame Pandas. Cette méthode est utilisée pour trouver la valeur maximale dans un DataFrame. Nous explorerons la syntaxe, les paramètres et la manière d'utiliser cette méthode à l'aide d'exemples.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Créer un DataFrame
Tout d'abord, créons un DataFrame pour comprendre la méthode max() et comment elle fonctionne. Nous utiliserons le code suivant :
import pandas as pd
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print(df)
Ce code crée un DataFrame avec quatre colonnes : A, B, C et D. Chaque colonne a trois valeurs.
Trouver les valeurs maximales sur l'axe des index
Ensuite, trouvons les valeurs maximales sur l'axe des index (les lignes) du DataFrame. Nous passerons axis=0 en tant que paramètre à la méthode max(). Considérez le code ci-dessous :
max_values = df.max(axis=0)
print(max_values)
Ce code affiche les valeurs maximales sur l'axe des index pour chaque colonne.
Trouver les valeurs maximales sur l'axe des colonnes
Maintenant, trouvons les valeurs maximales sur l'axe des colonnes du DataFrame. Nous passerons axis=1 en tant que paramètre à la méthode max(). Considérez le code ci-dessous :
max_values = df.max(axis=1)
print(max_values)
Ce code affiche les valeurs maximales sur l'axe des colonnes pour chaque ligne.
Inclure les valeurs nulles
Parfois, notre DataFrame peut contenir des valeurs nulles. Pour inclure les valeurs nulles lors du calcul du maximum, nous pouvons utiliser le paramètre skipna = False. Considérez le code ci-dessous :
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
max_values = df.max(axis=0, skipna=False)
print(max_values)
Ce code affiche les valeurs maximales sur l'axe des index, y compris les valeurs nulles.
Exclure les valeurs nulles
Pour exclure les valeurs nulles lors du calcul du maximum, nous pouvons utiliser le paramètre skipna = True. Considérez le code ci-dessous :
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
max_values = df.max(axis=0, skipna=True)
print(max_values)
Ce code affiche les valeurs maximales sur l'axe des index, en excluant les valeurs nulles.
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode max() dans le DataFrame Pandas. Nous avons exploré la manière de trouver les valeurs maximales sur l'axe des index et sur l'axe des colonnes, en incluant ou en excluant les valeurs nulles. La méthode max() est utile pour trouver les plus hautes valeurs dans un DataFrame et peut être appliquée à diverses utilisations. Assurez-vous de reviser la syntaxe et les paramètres de la méthode max() pour l'appliquer efficacement dans vos propres projets.