다양한 파일 형식 다루기
이 단계에서는 다양한 파일 형식 및 구분 기호와 함께 column 명령을 사용하는 방법을 살펴보겠습니다. 이를 통해 column 유틸리티의 다재다능함과 다양한 유형의 데이터에 적용할 수 있는 방법을 이해할 수 있습니다.
CSV 파일로 작업하기
CSV(Comma-Separated Values, 쉼표로 구분된 값) 파일은 표 형식 데이터를 저장하는 데 널리 사용되는 형식입니다. 더 복잡한 CSV 파일을 만들고 column 명령을 사용하여 서식을 지정해 보겠습니다.
먼저, 새 CSV 파일을 만듭니다.
cd ~/project
echo -e "Name,Age,Occupation,City\nAlex,28,Engineer,Boston\nSamantha,35,Teacher,Chicago\nMohamed,42,Doctor,New York\nLin,31,Artist,San Francisco" > employees.csv
이 파일의 내용을 살펴보겠습니다.
cat employees.csv
다음과 같은 내용이 표시됩니다.
Name,Age,Occupation,City
Alex,28,Engineer,Boston
Samantha,35,Teacher,Chicago
Mohamed,42,Doctor,New York
Lin,31,Artist,San Francisco
이제 column 명령을 사용하여 이 CSV 파일의 서식을 지정해 보겠습니다.
column -t -s ',' employees.csv
출력은 다음과 같아야 합니다.
Name Age Occupation City
Alex 28 Engineer Boston
Samantha 35 Teacher Chicago
Mohamed 42 Doctor New York
Lin 31 Artist San Francisco
column 명령이 데이터를 정렬된 열로 깔끔하게 정렬하여 훨씬 쉽게 읽을 수 있음을 알 수 있습니다.
TSV 파일로 작업하기
TSV(Tab-Separated Values, 탭으로 구분된 값) 는 표 형식 데이터에 대한 또 다른 일반적인 형식입니다. TSV 파일을 만들고 column 명령을 사용하여 서식을 지정해 보겠습니다.
TSV 파일을 만듭니다.
echo -e "Product\tPrice\tCategory\nLaptop\t999.99\tElectronics\nBook\t12.50\tMedia\nChair\t149.50\tFurniture" > products.tsv
내용을 살펴보겠습니다.
cat products.tsv
다음과 같은 내용이 표시됩니다.
Product Price Category
Laptop 999.99 Electronics
Book 12.50 Media
Chair 149.50 Furniture
이제 column 명령을 사용하여 서식을 지정합니다. 탭은 column 명령의 기본 구분 기호이므로 구분 기호를 지정할 필요가 없습니다.
column -t products.tsv
출력은 다음과 같아야 합니다.
Product Price Category
Laptop 999.99 Electronics
Book 12.50 Media
Chair 149.50 Furniture
다양한 파일에 스크립트 사용하기
이제 이러한 다양한 파일에 columnize.sh 스크립트를 사용해 보겠습니다.
CSV 파일의 경우:
~/project/columnize.sh employees.csv ,
TSV 파일의 경우:
~/project/columnize.sh products.tsv $'\t'
참고: 두 번째 명령에서 탭 문자를 나타내기 위해 $'\t'를 사용하고 있습니다. 이는 탭과 같은 특수 문자를 포함할 수 있도록 하는 bash 의 특수 구문입니다.
두 명령 모두 깔끔하게 서식이 지정된 출력을 생성하여 다양한 파일 형식 및 구분 기호로 스크립트의 유연성을 보여줍니다.
이 단계에서는 column 명령과 스크립트를 사용하여 다양한 유형의 표 형식 데이터를 서식 지정하여 더 읽기 쉽고 분석하기 쉽게 만드는 방법을 보여주었습니다.