Lesen von CSV-Dateien mit der OpenCSV-Bibliothek
In diesem Schritt werden wir unseren dritten Ansatz zum Lesen von CSV-Dateien implementieren, indem wir die OpenCSV-Bibliothek verwenden. OpenCSV ist eine Drittanbieter-Bibliothek, die robuste CSV-Parsing-Fähigkeiten bietet und komplexe Szenarien wie Felder mit Kommas oder Zeilenumbrüchen in Anführungszeichen verarbeiten kann.
Grundlagen zu OpenCSV
OpenCSV ist eine CSV-Parser-Bibliothek für Java, die alle gängigen CSV-Formatvariationen unterstützt. Im Gegensatz zu den vorherigen Ansätzen behandelt OpenCSV korrekt Anführungszeichen umgebene Felder, die Kommas, Zeilenumbrüche und andere Sonderzeichen enthalten, die sonst einfache Komma-Trennungen stören würden.
Einrichten von OpenCSV
Zunächst laden wir die OpenCSV-Bibliothek und ihre Abhängigkeiten herunter:
cd ~/project
mkdir -p lib
curl -L -o lib/opencsv-5.7.1.jar https://repo1.maven.org/maven2/com/opencsv/opencsv/5.7.1/opencsv-5.7.1.jar
curl -L -o lib/commons-lang3-3.12.0.jar https://repo1.maven.org/maven2/org/apache/commons/commons-lang3/3.12.0/commons-lang3-3.12.0.jar
curl -L -o lib/commons-text-1.10.0.jar https://repo1.maven.org/maven2/org/apache/commons/commons-text/1.10.0/commons-text-1.10.0.jar
curl -L -o lib/commons-beanutils-1.9.4.jar https://repo1.maven.org/maven2/commons-beanutils/commons-beanutils/1.9.4/commons-beanutils-1.9.4.jar
curl -L -o lib/commons-collections-3.2.2.jar https://repo1.maven.org/maven2/commons-collections/commons-collections/3.2.2/commons-collections-3.2.2.jar
curl -L -o lib/commons-logging-1.2.jar https://repo1.maven.org/maven2/commons-logging/commons-logging/1.2/commons-logging-1.2.jar
Erstellen einer komplexeren CSV-Datei
Wir erstellen nun eine komplexere CSV-Datei, die Anführungszeichen umgebene Felder mit Kommas enthält:
echo 'name,description,price
"Laptop","High-performance laptop, with SSD",999.99
"Smartphone","Latest model, with dual camera",499.99
"Headphones","Noise-canceling, wireless",149.99' > ~/project/products.csv
Implementierung des CSV-Lesens mit OpenCSV
Jetzt aktualisieren wir die Datei CSVReaderDemo.java
, um die CSV-Datei mit OpenCSV zu lesen. Ersetzen Sie den gesamten Inhalt der Datei durch den folgenden Code:
import com.opencsv.CSVReader;
import com.opencsv.exceptions.CsvValidationException;
import java.io.FileReader;
import java.io.IOException;
public class CSVReaderDemo {
public static void main(String[] args) {
System.out.println("Reading CSV using OpenCSV");
// Path to our CSV file with complex data
String csvFile = "products.csv";
try (CSVReader reader = new CSVReader(new FileReader(csvFile))) {
// Read and print the header
String[] header = reader.readNext();
if (header != null) {
System.out.println("\nHeader: " + String.join(", ", header));
}
// Read and print each line
String[] nextLine;
int rowNumber = 1;
System.out.println("\nData read from CSV file:");
while ((nextLine = reader.readNext()) != null) {
System.out.println("Row " + rowNumber + ":");
for (int i = 0; i < nextLine.length; i++) {
System.out.println(" " + header[i] + ": " + nextLine[i]);
}
rowNumber++;
System.out.println();
}
} catch (IOException | CsvValidationException e) {
System.err.println("Error reading the CSV file: " + e.getMessage());
e.printStackTrace();
}
}
}
Lassen Sie uns unseren aktualisierten Code kompilieren und ausführen:
cd ~/project
javac -cp ".:lib/*" -d . src/CSVReaderDemo.java
java -cp ".:lib/*" CSVReaderDemo
Sie sollten eine Ausgabe ähnlich der folgenden sehen:
Reading CSV using OpenCSV
Header: name, description, price
Data read from CSV file:
Row 1:
name: Laptop
description: High-performance laptop, with SSD
price: 999.99
Row 2:
name: Smartphone
description: Latest model, with dual camera
price: 499.99
Row 3:
name: Headphones
description: Noise-canceling, wireless
price: 149.99
Erklärung des Codes
- Wir importieren die notwendigen Klassen aus der OpenCSV-Bibliothek und Java I/O.
- Wir definieren den Pfad zu unserer CSV-Datei (
products.csv
).
- Wir erstellen ein
CSVReader
-Objekt, um die CSV-Datei zu lesen.
- Wir lesen die Kopfzeile mit
reader.readNext()
und speichern sie für die spätere Verwendung.
- Dann lesen wir jede nachfolgende Zeile mit
reader.readNext()
in einer Schleife, bis keine Zeilen mehr vorhanden sind.
- Für jede Zeile geben wir jedes Feld zusammen mit seinem entsprechenden Kopfzeilentitel aus.
Die OpenCSV-Bibliothek behandelt die komplexe CSV-Formatierung automatisch und parst Felder mit Anführungszeichen umgebenen Kommas korrekt. Dies macht es ideal für reale CSV-Dateien, die komplexe Daten enthalten können.
Vorteile von OpenCSV
OpenCSV bietet mehrere Vorteile gegenüber den grundlegenden Ansätzen:
- Es behandelt korrekt Anführungszeichen umgebene Felder, die Kommas, Zeilenumbrüche und andere Sonderzeichen enthalten.
- Es bietet integrierte Unterstützung für das Lesen in Java-Objekte (Beans).
- Es unterstützt erweiterte Funktionen wie benutzerdefinierte Trennzeichen, Anführungszeichen und Escape-Zeichen.
- Es verarbeitet große CSV-Dateien effizient.
Für die meisten realen Anwendungen, die mit CSV-Dateien umgehen, ist die Verwendung einer speziellen Bibliothek wie OpenCSV der empfohlene Ansatz.