
Pandas Textuelle Daten
In diesem Lab werden wir untersuchen, wie man textuelle Daten mit der Pandas-Bibliothek in Python manipulieren kann. Sie werden lernen, wie man Zeichen in einem String in Kleinbuchstaben umwandelt, Teile eines Strings extrahiert, Stringwerte ersetzt und vieles mehr mit verschiedenen integrierten Pandas-Methoden.
PythonPandas

Fehlende Daten behandeln
In diesem Lab werden wir lernen, wie man fehlende Daten in pandas behandelt, einem häufigen Problem in der Datenanalyse. Wir werden behandeln, wie man fehlende Daten erkennt, fehlende Werte einfüllt und Daten, die nicht benötigt werden, löscht. Wir werden auch das experimentelle NA-Skalar in pandas besprechen, der verwendet werden kann, um fehlende Werte zu kennzeichnen.
PythonPandas

Arbeiten mit nullable Ganzzahlen
In diesem Lab werden wir untersuchen, wie man den nullable Ganzzahl-Datentyp in pandas verwendet, was eine effiziente Methode ist, um Ganzzahl-Daten zu verarbeiten, die möglicherweise fehlende Werte enthalten. Wir werden lernen, wie man Arrays mit diesem Datentyp konstruiert, Operationen durchführt und fehlende Werte effektiv behandelt.
PythonPandas

Grundlagen der Datenmanipulation mit Pandas
Dieses Python-Pandas-Lab hat zum Ziel, Ihnen die grundlegenden Operationen der pandas-Bibliothek vorzustellen, die ein leistungsstarkes Datenmanipulationswerkzeug in Python ist. Während dieses Labs werden Sie mit zahlreichen Beispielen und Codeausschnitten arbeiten, um Ihr Verständnis von pandas zu vertiefen.
PythonPandas

Pandas Grundlagen: DataFrame-Speicher und -Operationen
Willkommen im Pandas-Grundlagen-Lab! In diesem Lab werden wir einige grundlegende Aspekte der Pandas-Bibliothek untersuchen: der Speicherbedarf von DataFrames, das Umgang mit if/Wahrheitsausdrücken, das Verwenden von benutzerdefinierten Funktionen (UDFs), das Umgang mit NA-Werten, die Unterschiede zu NumPy und die Berücksichtigung der Threadsicherheit.
PythonPandas

Das Umgang mit doppelten Labels
In diesem Lab werden wir lernen, wie man in pandas mit doppelten Labels umgeht. Pandas ist eine leistungsstarke Datenmanipulationsbibliothek in Python. Oft stoßen wir auf Daten mit doppelten Zeilen- oder Spaltenbezeichnungen, und es ist entscheidend, zu verstehen, wie man diese Duplikate erkennen und behandeln kann.
PythonPandas

Arbeiten mit Datenstrukturen in Pandas
Pandas ist eine leistungsstarke Python-Bibliothek zur Datenmanipulation und -analyse. Seine grundlegenden Datenstrukturen, Series und DataFrame, ermöglichen es Ihnen, strukturierte Daten zu speichern und zu manipulieren. In diesem Lab erhalten Sie einen schrittweisen Leitfaden darüber, wie Sie mit diesen Datenstrukturen arbeiten, von der Erstellung bis zur Manipulation und zum Ausrichten.
PythonPandas

Pandas Copy-On-Write Implementierungsleitfaden
Dieses Lab bietet einen schrittweisen Leitfaden zum Verständnis und zur Implementierung des Konzepts von Copy-On-Write (CoW) in Python Pandas. CoW ist eine Optimierungsstrategie, die die Leistung und den Arbeitsspeicherbedarf verbessert, indem Kopien so lange wie möglich verzögert werden. Es hilft auch, versehentliche Änderungen mehrerer Objekte zu vermeiden.
PythonPandas

Arbeiten mit nullable Boolean-Daten
In diesem Lab werden wir den nullable Boolean-Datentyp untersuchen, der von der Pandas-Bibliothek in Python zur Verfügung gestellt wird. Wir werden lernen, wie diese Funktion bei der Indizierung und logischen Operationen verwendet wird und wie sie sich von traditionellen booleschen Operationen aufgrund der Anwesenheit von 'NA'-Werten unterscheidet.
PythonPandas

Einführung in Pandas
In diesem Lab werden wir Ihnen die Grundlagen von Pandas, einer leistungsstarken Datenmanipulationsbibliothek in Python, vorstellen. Wir werden Sie durch verschiedene Aufgaben wie das Importieren von Pandas, das Erstellen und Anzeigen von Daten, die Datenauswahl, Operationen und vieles mehr leiten.
PythonPandas

Das Verwenden von spärren Strukturen in Pandas
In diesem Lab wird Ihnen gezeigt, wie Sie spärre Datenstrukturen in der Pandas-Bibliothek verwenden. Dies ist in Szenarien nützlich, in denen wir große Datenmengen haben, von denen die meisten ähnlich sind (wie Null oder NaN) und daher in der Arbeitsspeicher effizienter dargestellt werden können. Wir werden uns mit SparseArray, SparseDtype, spärrem Zugriff, spärren Berechnungen und der Interaktion mit scipy spärren Matrizen befassen.
PythonPandas

Verstärken von Pandas mit PyArrow
In diesem Lab wird Ihnen der Prozess der Verwendung von PyArrow in Pandas gezeigt, um die Funktionalität zu erweitern und die Leistung verschiedener APIs zu verbessern. PyArrow erweitert Pandas mit umfangreicheren Datentypen, Unterstützung für fehlende Daten für alle Datentypen, Integration von IO-Lesern und Interoperabilität mit anderen Datenrahmenbibliotheken.
PythonPandas

Datenumformung mit Pandas
Beim Datenanalyse wird es häufig passieren, dass Datensätze nicht in der von uns gewünschten Weise angeordnet sind. Die Datenumformung bezieht sich auf den Prozess, wie Daten in Zeilen und Spalten organisiert werden. In diesem Lab werden wir einige der wichtigsten Methoden in Pandas zur Datenumformung untersuchen, einschließlich Pivot, Stack, Unstack, Melt, Kreuztabulationen, Zerstückelung, Faktorisierung und Explodieren.
PythonPandas

Skalierung großer Datensätze
Dieses Lab konzentriert sich darauf, wie man Datenanalysen auf größere Datensätze skalieren kann, indem man pandas verwendet. Es behandelt Methoden wie das Laden weniger Daten, die Verwendung effizienter Datentypen, Chunking (Teilen von Daten) und die Nutzung anderer Bibliotheken wie Dask. Es ist wichtig zu beachten, dass pandas eher für In-Memory-Analysen geeignet ist und möglicherweise nicht das beste Werkzeug für sehr große Datensätze ist.
PandasPython

Fensteroperationen in Pandas
In diesem Lab werden wir die Fensteroperationen in Pandas erkunden, einschließlich rollender Fenster, expandierender Fenster und exponentiell gewichteter Fenster. Fensteroperationen sind nützlich für die Durchführung von Aggregationen über eine gleitende Partition von Werten.
PythonPandas

Text-Datenverarbeitung in Pandas
In diesem Lab wird gezeigt, wie man in Pandas mit Text-Daten umgeht. Wir werden lernen, wie man Text-Daten speichert, String-Methoden für die Datenaufbereitung und -Transformation verwendet und Teilstrings mit regulären Ausdrücken extrahiert. Wir werden auch lernen, wie man Dummy-Variablen für maschinelle Lernalgorithmen erstellt.
PythonPandas

Arbeiten mit Zeitintervallen (Timedeltas)
Dieses Lab führt Sie durch den Prozess der Arbeit mit Zeitintervallen (Timedeltas) in Python mithilfe der pandas-Bibliothek. Ein Zeitintervall (Timedelta) repräsentiert eine Zeitspanne oder einen Zeitunterschied. Wir werden verschiedene Möglichkeiten zur Konstruktion, Manipulation und Bearbeitung von Zeitintervallen (Timedeltas) erkunden.
PythonPandas

Pandas Append-Methode
In diesem Tutorial lernen Sie, wie die append()-Methode in Python Pandas verwendet wird. Die append()-Methode ermöglicht es Ihnen, Zeilen aus einem DataFrame an einen anderen anzuhängen und gibt ein neues DataFrame-Objekt zurück. Sie kann auch Spalten aus dem angehängten DataFrame hinzufügen, sofern sie im aufrufenden DataFrame noch nicht vorhanden sind.
PythonPandas