Pandas DataFrame Letzte Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir ein Beispiel zum Verwenden der last()-Methode des Pandas DataFrames durchgehen. Die last()-Methode ermöglicht es uns, die letzten paar Zeilen von Zeitreihendaten basierend auf einem Datumsversatz auszuwählen. Dies kann nützlich sein, wenn man mit DataFrames arbeitet, deren Index Datum ist. Die Methode gibt den DataFrame mit den ausgewählten Zeilen zurück und wirft einen TypeError, wenn der Index kein DatetimeIndex ist.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Erstellen eines DataFrames mit Datum als Index

Zunächst erstellen wir ein DataFrame mit Datum als Index. Dies wird es uns ermöglichen, die last()-Methode zu verwenden, um Zeilen basierend auf Datum auszuwählen. Wir werden die date_range()-Funktion aus Pandas verwenden, um einen Zeitraum von Daten zu erstellen.

import pandas as pd

## Erstellen eines Zeitraums von Daten
dates = pd.date_range(start='2021-01-01', end='2021-01-10')

## Erstellen eines DataFrames mit Datum als Index
df = pd.DataFrame({'A': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]}, index=dates)

## Anzeige des DataFrames
print(df)

Wählen Sie die letzten paar Zeilen basierend auf einem Datumsversatz

Jetzt, da wir unser DataFrame mit Datum als Index haben, verwenden wir die last()-Methode, um die letzten paar Zeilen basierend auf einem Datumsversatz auszuwählen. Der Versatz kann auf verschiedene Weise angegeben werden, z. B. als Zeichenfolge oder als DateOffset-Objekt. Beispielsweise können wir die letzten 3 Tage auswählen, indem wir '3D' als Versatz übergeben.

## Wählen Sie die letzten 3 Tage aus
last_3_days = df.last('3D')

## Zeigen Sie die ausgewählten Zeilen an
print(last_3_days)

Behandeln eines nicht-DatetimeIndex

Wenn der Index des DataFrames kein DatetimeIndex ist, wird die last()-Methode einen TypeError auslösen. Um dies zu behandeln, können wir den Typ des Indexes überprüfen, bevor wir die Methode aufrufen.

import pandas as pd

## Erstellen eines DataFrames mit einem nicht-DatetimeIndex
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]}, index=[1, 2, 3, 4, 5])

## Überprüfen, ob der Index ein DatetimeIndex ist
if isinstance(df.index, pd.DatetimeIndex):
    ## Wählen Sie die letzten 3 Zeilen aus
    last_3_rows = df.last(3)
    print(last_3_rows)
else:
    print("Der Index ist kein DatetimeIndex.")

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die last()-Methode des Pandas DataFrames verwendet, um die letzten paar Zeilen von Zeitreihendaten basierend auf einem Datumsversatz auszuwählen. Wir haben gesehen, wie man ein DataFrame mit Datum als Index erstellt und wie man die last()-Methode verwendet, um Zeilen basierend auf einem Datumsversatz auszuwählen. Wir haben auch gelernt, wie man einen nicht-DatetimeIndex beim Verwenden der last()-Methode behandelt. Diese Methode kann nützlich sein, wenn man mit Zeitreihendaten arbeitet und bestimmte Zeiträume auswählen muss.