Comprendre les données CSV en Python
CSV (Comma-Separated Values, valeurs séparées par des virgules) est un format de fichier largement utilisé pour stocker et échanger des données tabulaires. En Python, le module intégré csv
offre un moyen pratique de travailler avec les fichiers CSV.
Qu'est-ce qu'un fichier CSV?
Un fichier CSV est un fichier texte brut qui stocke des données au format tabulaire, où chaque ligne représente un enregistrement et chaque colonne représente un champ ou un attribut de cet enregistrement. Les valeurs de chaque ligne sont séparées par un délimiteur, généralement une virgule (,
), mais d'autres délimiteurs tels que des points-virgules (;
) ou des tabulations (\t
) peuvent également être utilisés.
Accéder aux données CSV en Python
Pour travailler avec des données CSV en Python, vous pouvez utiliser le module csv
, qui fournit des fonctions et des classes pour lire et écrire des fichiers CSV. Voici un exemple de lecture d'un fichier CSV :
import csv
with open('data.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
print(row)
Ce code ouvre le fichier data.csv
, crée un objet csv.reader
, puis parcourt chaque ligne du fichier et affiche le contenu de chaque ligne.
Structure d'un fichier CSV
Un fichier CSV typique a la structure suivante :
header_row, header_row, header_row
data_row, data_row, data_row
data_row, data_row, data_row
La première ligne est généralement la ligne d'en-tête, qui contient les noms des colonnes. Les lignes suivantes contiennent les données réelles.
Gérer différents délimiteurs
Par défaut, le module csv
en Python utilise une virgule (,
) comme délimiteur. Cependant, vous pouvez spécifier un autre délimiteur lors de la lecture ou de l'écriture d'un fichier CSV :
import csv
with open('data.tsv', 'r') as file:
reader = csv.reader(file, delimiter='\t')
for row in reader:
print(row)
Dans cet exemple, le fichier CSV est séparé par des tabulations (TSV), donc nous utilisons '\t'
comme délimiteur.
Conclusion
Dans cette section, vous avez appris les bases des données CSV en Python, y compris la structure d'un fichier CSV, comment accéder aux données CSV à l'aide du module csv
et comment gérer différents délimiteurs. Cette compréhension sera essentielle lorsque vous passerez à la gestion des données manquantes ou corrompues dans les fichiers CSV.