In diesem Schritt werden wir untersuchen, wie man den column
-Befehl mit verschiedenen Dateiformaten und Trennzeichen verwendet. Dies wird Ihnen helfen, die Vielseitigkeit des column
-Hilfsprogramms zu verstehen und wie es auf verschiedene Datentypen angewendet werden kann.
Arbeiten mit CSV-Dateien
CSV (Comma-Separated Values, Komma-separierte Werte) -Dateien sind ein gängiges Format zum Speichern tabellarischer Daten. Erstellen wir eine komplexere CSV-Datei und verwenden den column
-Befehl, um sie zu formatieren.
Zunächst erstellen wir eine neue CSV-Datei:
cd ~/project
echo -e "Name,Age,Occupation,City\nAlex,28,Engineer,Boston\nSamantha,35,Teacher,Chicago\nMohamed,42,Doctor,New York\nLin,31,Artist,San Francisco" > employees.csv
Lassen Sie uns den Inhalt dieser Datei untersuchen:
cat employees.csv
Sie sollten sehen:
Name,Age,Occupation,City
Alex,28,Engineer,Boston
Samantha,35,Teacher,Chicago
Mohamed,42,Doctor,New York
Lin,31,Artist,San Francisco
Jetzt verwenden wir den column
-Befehl, um diese CSV-Datei zu formatieren:
column -t -s ',' employees.csv
Die Ausgabe sollte so aussehen:
Name Age Occupation City
Alex 28 Engineer Boston
Samantha 35 Teacher Chicago
Mohamed 42 Doctor New York
Lin 31 Artist San Francisco
Beachten Sie, wie der column
-Befehl die Daten ordentlich in ausgerichteten Spalten angeordnet hat, was es viel einfacher macht, sie zu lesen.
Arbeiten mit TSV-Dateien
TSV (Tab-Separated Values, Tabulator-separierte Werte) ist ein weiteres gängiges Format für tabellarische Daten. Erstellen wir eine TSV-Datei und formatieren sie mit dem column
-Befehl.
Erstellen Sie eine TSV-Datei:
echo -e "Product\tPrice\tCategory\nLaptop\t999.99\tElectronics\nBook\t12.50\tMedia\nChair\t149.50\tFurniture" > products.tsv
Schauen wir uns den Inhalt an:
cat products.tsv
Sie sollten sehen:
Product Price Category
Laptop 999.99 Electronics
Book 12.50 Media
Chair 149.50 Furniture
Jetzt formatieren wir es mit dem column
-Befehl. Da Tabulatoren das Standard-Trennzeichen für den column
-Befehl sind, müssen wir kein Trennzeichen angeben:
column -t products.tsv
Die Ausgabe sollte so aussehen:
Product Price Category
Laptop 999.99 Electronics
Book 12.50 Media
Chair 149.50 Furniture
Verwenden unseres Skripts mit verschiedenen Dateien
Jetzt verwenden wir unser columnize.sh
-Skript mit diesen verschiedenen Dateien:
Für die CSV-Datei:
~/project/columnize.sh employees.csv ,
Für die TSV-Datei:
~/project/columnize.sh products.tsv $'\t'
Hinweis: In dem zweiten Befehl verwenden wir $'\t'
, um ein Tabulatorzeichen darzustellen. Dies ist eine spezielle Syntax in bash, die es uns ermöglicht, Sonderzeichen wie Tabulatoren einzuschließen.
Beide Befehle sollten eine schön formatierte Ausgabe erzeugen, was die Flexibilität unseres Skripts mit verschiedenen Dateiformaten und Trennzeichen zeigt.
Dieser Schritt hat gezeigt, wie der column
-Befehl und unser Skript verwendet werden können, um verschiedene Arten von tabellarischen Daten zu formatieren, wodurch sie lesbarer und leichter zu analysieren werden.