Einführung
Dieses Lab konzentriert sich darauf, wie man Datenanalysen auf größere Datensätze mit pandas skalieren kann. Es behandelt Methoden wie das Laden weniger Daten, die Verwendung effizienter Datentypen, das Teilen von Daten (chunking) und die Nutzung anderer Bibliotheken wie Dask. Es ist wichtig zu beachten, dass pandas eher für In-Memory-Analysen geeignet ist und möglicherweise nicht das beste Tool für sehr große Datensätze ist.
Tipps für die virtuelle Maschine (VM)
Nachdem die VM gestartet wurde, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und auf Jupyter Notebook für die Übung zuzugreifen.
Manchmal müssen Sie möglicherweise einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie während des Lernens Probleme haben, können Sie sich gerne an Labby wenden. Geben Sie uns nach der Sitzung Feedback, und wir werden das Problem umgehend für Sie lösen.