Benutzerdefinierter Strich-Formatter für Zeitreihen

PythonPythonBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Wenn man tägliche Daten wie finanzielle Zeitreihen darstellt, möchte man oft die Tage weglassen, an denen keine Daten vorliegen, wie z. B. Wochenenden. Dadurch können die Daten in regelmäßigen Abständen dargestellt werden, ohne zusätzliche Leerzeichen für die tage ohne Daten. In diesem Lab werden wir lernen, wie man einen 'Index-Formatter' verwendet, um das gewünschte Diagramm zu erhalten.

VM-Tipps

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren von erforderlichen Bibliotheken und Daten

Wir müssen zunächst die erforderlichen Bibliotheken importieren, nämlich matplotlib, numpy und matplotlib.cbook. Wir müssen auch ein numpy-Record-Array aus yahoo-csv-Daten mit den Feldern date, open, high, low, close, volume, adj_close aus dem mpl-data/sample_data-Verzeichnis laden. Das Record-Array speichert das Datum als np.datetime64 mit einem Tagesformat ('D') in der date-Spalte. Wir werden diese Daten verwenden, um die finanzielle Zeitreihe zu plotten.

import matplotlib.pyplot as plt
import numpy as np
import matplotlib.cbook as cbook

## Lade Daten aus dem sample_data-Verzeichnis
r = cbook.get_sample_data('goog.npz')['price_data'].view(np.recarray)
r = r[:9]  ## Hole die ersten 9 Tage

Plotten von Daten mit standardmäßigen Lücken an Wochenenden

Wir werden zunächst die Daten mit den standardmäßigen Lücken an Wochenenden mit der plot-Funktion in matplotlib plotten. Wir werden auch die Lücken in den täglichen Daten mit weißen durchgezogenen Linien hervorheben.

## Plot data with gaps on weekends
fig, ax1 = plt.subplots(figsize=(6, 3))
ax1.plot(r.date, r.adj_close, 'o-')

## Highlight gaps in daily data
gaps = np.flatnonzero(np.diff(r.date) > np.timedelta64(1, 'D'))
for gap in r[['date', 'adj_close']][np.stack((gaps, gaps + 1)).T]:
    ax1.plot(gap.date, gap.adj_close, 'w--', lw=2)
ax1.legend(handles=[ml.Line2D([], [], ls='--', label='Gaps in daily data')])

ax1.set_title("Plotting Data with Default Gaps on Weekends")
ax1.xaxis.set_major_locator(DayLocator())
ax1.xaxis.set_major_formatter(DateFormatter('%a'))

Erstellen eines benutzerdefinierten Index-Formatters

Um die Daten gegen einen Index zu plotten, der von 0, 1,... len(data) geht, werden wir einen benutzerdefinierten Index-Formatter erstellen. Dieser Formatter wird die Striche als Zeiten statt als ganze Zahlen formatieren.

## Create custom index formatter
fig, ax2 = plt.subplots(figsize=(6, 3))
ax2.plot(r.adj_close, 'o-')

## Format x-axis as times
def format_date(x, _):
    try:
        ## convert datetime64 to datetime, and use datetime's strftime:
        return r.date[round(x)].item().strftime('%a')
    except IndexError:
        pass

ax2.set_title("Creating Custom Index Formatter")
ax2.xaxis.set_major_formatter(format_date)  ## internally creates FuncFormatter

Verwenden eines aufrufbaren Objekts als Formatter

Anstatt eine Funktion an .Axis.set_major_formatter zu übergeben, können wir jedes andere aufrufbare Objekt verwenden, wie z. B. eine Instanz einer Klasse, die __call__ implementiert. In diesem Schritt werden wir eine Klasse MyFormatter erstellen, die die Striche als Zeiten formatiert.

## Use a callable for formatter
class MyFormatter(Formatter):
    def __init__(self, dates, fmt='%a'):
        self.dates = dates
        self.fmt = fmt

    def __call__(self, x, pos=0):
        """Return the label for time x at position pos."""
        try:
            return self.dates[round(x)].item().strftime(self.fmt)
        except IndexError:
            pass

ax2.xaxis.set_major_formatter(MyFormatter(r.date, '%a'))

Anzeigen des Plots

Wir werden nun den Plot mit der show-Funktion in matplotlib anzeigen.

plt.show()

Zusammenfassung

In diesem Lab haben wir gelernt, wie man einen benutzerdefinierten Index-Formatter verwendet, um finanzielle Zeitreihen ohne Lücken an Wochenenden zu plotten. Wir haben auch gelernt, wie man statt einer Funktion ein aufrufbares Objekt für den Formatter verwendet. Mit diesen Techniken können wir visuell ansprechendere Plots von täglichen Daten erstellen.