Meisterung der Pandas DataFrame between_time-Methode

Einführung

In diesem Lab werden wir lernen, wie die between_time()-Methode in einem Pandas DataFrame verwendet wird. Diese Methode ermöglicht es uns, Werte zwischen bestimmten Zeiten des Tages auszuwählen. Sie kann verwendet werden, um spezifische zeitbasierte Daten aus einem DataFrame zu filtern und zu extrahieren.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importiere die erforderlichen Bibliotheken

Bevor wir die between_time()-Methode verwenden können, müssen wir die erforderlichen Bibliotheken importieren. In diesem Lab werden wir die Pandas-Bibliothek verwenden.

import pandas as pd

Erstelle einen DataFrame

Als nächstes erstellen wir einen DataFrame, der zeitbasierte Daten enthält. Wir können die date_range()-Funktion aus Pandas verwenden, um eine Sequenz von Daten zu generieren, und legen diese dann als Index des DataFrames fest.

values = pd.date_range('2021-01-01', periods=4, freq='20T')
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=values)

Wähle Werte zwischen einem bestimmten Zeitpunkt

Jetzt, wo wir unseren DataFrame haben, verwenden wir die between_time()-Methode, um Werte zwischen einem bestimmten Start- und Endzeitpunkt auszuwählen. Wir können einfach den Start- und Endzeitpunkt als Argumente an die Methode übergeben. Die Methode wird einen neuen DataFrame zurückgeben, der nur die Zeilen enthält, die innerhalb des angegebenen Zeitraums fallen.

df_selected = df.between_time('00:00', '01:00')

Anpassen der include_start- und include_end-Parameter

Die between_time()-Methode ermöglicht es uns auch, die Parameter include_start und include_end anzupassen. Standardmäßig sind diese Parameter auf True gesetzt, was bedeutet, dass der Start- und der Endzeitpunkt im Ergebnis enthalten sind.

df_selected = df.between_time('00:00', '01:00', include_start=False, include_end=False)

Behandle den Fehler bei nicht DatetimeIndex

Wenn der Index des DataFrames kein DatetimeIndex ist, wird die between_time()-Methode einen TypeError auslösen. Um diesen Fehler zu vermeiden, stellen Sie sicher, dass der Index Ihres DataFrames ein DatetimeIndex ist.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=[1, 2, 3, 4])
## Dies wird einen TypeError auslösen
df_selected = df.between_time('00:00', '01:00')

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die between_time()-Methode in einem Pandas DataFrame verwendet. Diese Methode ermöglicht es uns, Werte zwischen bestimmten Zeiten des Tages auszuwählen. Wir können die Start- und Endzeiten sowie die Einbeziehung der Start- und Endzeiten anpassen, um spezifische zeitbasierte Daten aus einem DataFrame zu filtern und zu extrahieren. Es ist wichtig, sicherzustellen, dass der Index des DataFrames ein DatetimeIndex ist, um TypeError-Fehler zu vermeiden. Diese Methode kann in verschiedenen Anwendungen nützlich sein, wie beispielsweise die Analyse von Zeitreihendaten und das Extrahieren bestimmter Zeitperioden aus einem Datensatz.