Pandas DataFrame Count Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir uns die count()-Methode der Pandas DataFrame-Klasse ansehen. Die count()-Methode wird verwendet, um die Anzahl der nicht NULL-Werte in einem DataFrame zu zählen, entweder für jede Spalte oder für jede Zeile.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

Zunächst importieren wir die erforderlichen Bibliotheken für dieses Lab:

import pandas as pd
import numpy as np

Erstellen eines DataFrames

Als nächstes erstellen wir ein DataFrame, das wir für die Beispiele in diesem Lab verwenden werden. Unser DataFrame wird Informationen über Schüler enthalten, wie beispielsweise ihre Namen, Matrikelnummern, Fächer und Noten.

df = pd.DataFrame([
    ['Abhishek', '101', 'Science', 90],
    ['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Zählen der nicht-leeren Werte pro Spalte

Um die Anzahl der nicht-leeren Werte für jede Spalte im DataFrame zu zählen, können wir die count()-Methode ohne Parameter verwenden. Dies wird ein Series-Objekt zurückgeben, wobei der Index die Spaltennamen darstellt und die Werte die Anzahl der nicht-leeren Werte in jeder Spalte.

column_counts = df.count()
print(column_counts)

Ausgabe:

Name       2
Roll No    2
Subject    1
Marks      2
dtype: int64

Zählen der nicht-leeren Werte pro Zeile

Um die Anzahl der nicht-leeren Werte für jede Zeile im DataFrame zu zählen, können wir die count()-Methode mit dem Parameter axis auf 1 gesetzt verwenden. Dies wird ein Series-Objekt zurückgeben, wobei der Index die Zeilennummern darstellt und die Werte die Anzahl der nicht-leeren Werte in jeder Zeile.

row_counts = df.count(axis=1)
print(row_counts)

Ausgabe:

0    4
1    3
dtype: int64

Zählen der numerischen nicht-leeren Werte pro Zeile

Wenn wir nur die numerischen nicht-leeren Werte für jede Zeile zählen möchten, können wir die count()-Methode mit dem Parameter numeric_only auf True gesetzt verwenden. Dies wird nur die Spalten mit numerischen Datentypen (float, int) zählen und Spalten mit nicht-numerischen Datentypen (object) ausschließen.

numeric_counts = df.count(numeric_only=True)
print(numeric_counts)

Ausgabe:

Roll No    2
Marks      2
dtype: int64

Zusammenfassung

Herzlichen Glückwunsch! Sie haben dieses Lab zu der Pandas DataFrame-count()-Methode erfolgreich abgeschlossen. In diesem Lab haben Sie gelernt, wie man die Anzahl der nicht-leeren Werte in einem DataFrame für jede Spalte oder Zeile mit der count()-Methode zählt. Sie haben auch gelernt, wie man nur die numerischen nicht-leeren Werte mit dem Parameter numeric_only zählt. Halten Sie an der Übung und erkunden Sie verschiedene Methoden der Pandas-Bibliothek, um sich in der Datenanalyse und -manipulation mit Python noch professioneller zu machen. Viel Spaß beim Programmieren!