Das Verständnis von CSV-Daten in Python
CSV (Comma-Separated Values, deutsch: durch Kommas getrennte Werte) ist ein weit verbreitetes Dateiformat zum Speichern und Austauschen von tabellarischen Daten. In Python bietet das eingebaute csv
-Modul eine bequeme Möglichkeit, mit CSV-Dateien zu arbeiten.
Was ist eine CSV-Datei?
Eine CSV-Datei ist eine reine Textdatei, die Daten in tabellarischer Form speichert. Dabei repräsentiert jede Zeile einen Datensatz, und jede Spalte ein Feld oder Attribut dieses Datensatzes. Die Werte in jeder Zeile werden durch ein Trennzeichen getrennt, typischerweise ein Komma (,
), aber auch andere Trennzeichen wie Semikolons (;
) oder Tabulatoren (\t
) können verwendet werden.
Zugriff auf CSV-Daten in Python
Um in Python mit CSV-Daten zu arbeiten, können Sie das csv
-Modul verwenden, das Funktionen und Klassen zum Lesen und Schreiben von CSV-Dateien bereitstellt. Hier ist ein Beispiel, wie man eine CSV-Datei liest:
import csv
with open('data.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
print(row)
Dieser Code öffnet die data.csv
-Datei, erstellt ein csv.reader
-Objekt und iteriert dann über jede Zeile in der Datei, wobei der Inhalt jeder Zeile ausgegeben wird.
Struktur einer CSV-Datei
Eine typische CSV-Datei hat die folgende Struktur:
header_row, header_row, header_row
data_row, data_row, data_row
data_row, data_row, data_row
Die erste Zeile ist normalerweise die Kopfzeile, die die Namen der Spalten enthält. Die folgenden Zeilen enthalten die eigentlichen Daten.
Umgang mit verschiedenen Trennzeichen
Standardmäßig verwendet das csv
-Modul in Python ein Komma (,
) als Trennzeichen. Sie können jedoch ein anderes Trennzeichen angeben, wenn Sie eine CSV-Datei lesen oder schreiben:
import csv
with open('data.tsv', 'r') as file:
reader = csv.reader(file, delimiter='\t')
for row in reader:
print(row)
In diesem Beispiel ist die CSV-Datei tabulatorgetrennt (TSV), daher verwenden wir '\t'
als Trennzeichen.
Zusammenfassung
In diesem Abschnitt haben Sie die Grundlagen von CSV-Daten in Python kennengelernt, einschließlich der Struktur einer CSV-Datei, wie man mit dem csv
-Modul auf CSV-Daten zugreift und wie man verschiedene Trennzeichen behandelt. Dieses Verständnis wird von entscheidender Bedeutung sein, wenn Sie fortfahren und mit fehlenden oder beschädigten Daten in CSV-Dateien umgehen.