Praktische Beispiele für das Parsen von XML
In diesem Abschnitt werden wir einige praktische Beispiele für das Parsen von XML-Dateien mit den zuvor besprochenen Java-APIs untersuchen.
Parsen einer einfachen XML-Datei
Beginnen wir mit einer einfachen XML-Datei namens books.xml
:
<?xml version="1.0" encoding="UTF-8"?>
<library>
<book>
<title>The Great Gatsby</title>
<author>F. Scott Fitzgerald</author>
<year>1925</year>
</book>
<book>
<title>To Kill a Mockingbird</title>
<author>Harper Lee</author>
<year>1960</year>
</book>
</library>
Mit dem DOM-Parser können wir diese Datei parsen und die Buchinformationen extrahieren:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse("books.xml");
NodeList bookNodes = document.getElementsByTagName("book");
for (int i = 0; i < bookNodes.getLength(); i++) {
Node bookNode = bookNodes.item(i);
System.out.println("Title: " + bookNode.getElementsByTagName("title").item(0).getTextContent());
System.out.println("Author: " + bookNode.getElementsByTagName("author").item(0).getTextContent());
System.out.println("Year: " + bookNode.getElementsByTagName("year").item(0).getTextContent());
}
Parsen einer komplexen XML-Datei
Betrachten wir nun eine komplexere XML-Datei, die Namensräume (Namespaces) enthält:
<?xml version="1.0" encoding="UTF-8"?>
<library xmlns="http://example.com/library"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<book>
<dc:title>The Catcher in the Rye</dc:title>
<dc:creator>J.D. Salinger</dc:creator>
<dc:date>1951</dc:date>
</book>
<book>
<dc:title>1984</dc:title>
<dc:creator>George Orwell</dc:creator>
<dc:date>1949</dc:date>
</book>
</library>
Um diese Datei zu parsen und auf die Elemente mit Namensräumen zuzugreifen, können wir den folgenden Code verwenden:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(true);
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse("books.xml");
NodeList bookNodes = document.getElementsByTagNameNS("http://example.com/library", "book");
for (int i = 0; i < bookNodes.getLength(); i++) {
Node bookNode = bookNodes.item(i);
System.out.println("Title: " + bookNode.getElementsByTagNameNS("http://purl.org/dc/elements/1.1/", "title").item(0).getTextContent());
System.out.println("Author: " + bookNode.getElementsByTagNameNS("http://purl.org/dc/elements/1.1/", "creator").item(0).getTextContent());
System.out.println("Year: " + bookNode.getElementsByTagNameNS("http://purl.org/dc/elements/1.1/", "date").item(0).getTextContent());
}
Durch das Verständnis dieser praktischen Beispiele sollten Sie nun einen soliden Überblick darüber haben, wie Sie XML-Dateien mit Java-APIs parsen können.