Einführung
In diesem Projekt lernst du, wie du CSV-Daten bereinigen und reinigen kannst, indem du unvollständige, falsche und ungültige Daten entfernst. Ziel ist es, aus den Rohdaten einen sauberen Datensatz zu erstellen, der für weitere Analysen oder Verarbeitungen verwendet werden kann.
🎯 Aufgaben
In diesem Projekt wirst du lernen:
- Wie du die Projektumgebung einrichtest und die erforderlichen Dateien vorbereitest
- Wie du die erforderlichen Bibliotheken für die Datenbereinigung importierst
- Wie du die Rohdaten einliest und verarbeitest und verschiedene Arten von schmutzigen Daten überprüfst
- Wie du die bereinigten Daten in eine neue CSV-Datei schreibst
🏆 Errungenschaften
Nach Abschluss dieses Projekts wirst du in der Lage sein:
- Python und seine Standardbibliothek zum Umgang mit CSV-Daten zu verwenden
- Techniken zur Validierung und Bereinigung von Daten anzuwenden, wie das Überprüfen auf fehlende Werte, ungültige Formate und unrealistische Daten
- Einen Datenbereinigungsverfahren umzusetzen, um einen hochwertigen Datensatz zu erstellen
- Eine neue CSV-Datei mit den bereinigten Daten zu generieren