직원 데이터 처리하기

LinuxBeginner
지금 연습하기

소개

리눅스 명령줄 유틸리티의 세계에서 joinawk는 데이터 처리 능력을 크게 향상시킬 수 있는 강력한 도구입니다. 이번 챌린지에서는 자동화가 필요한 대규모 데이터셋을 다루며, 여러 소스의 데이터를 효과적으로 결합하고 처리하는 능력을 테스트합니다.

데이터 결합 및 처리

과제

  1. join 명령어를 사용하여 employees.txtdepartments.txt 두 파일의 데이터를 결합하세요.
  2. awk를 사용하여 결합된 데이터를 처리하고 지정된 형식으로 출력하세요.
  3. 출력 결과를 직원의 성 (Last Name) 을 기준으로 알파벳순으로 정렬하세요.

요구 사항

  • 모든 작업은 ~/project 디렉토리 내에서 수행해야 합니다.
  • join 명령어를 사용하여 employees.txtdepartments.txt를 결합하세요.
  • awk를 사용하여 출력 형식을 지정하세요.
  • 최종 결과물은 employee_departments.txt라는 파일로 저장해야 합니다.
  • 출력 내용은 직원의 성 (Last Name) 을 기준으로 알파벳순 정렬되어야 합니다.

예시

입력 파일 (간략화된 예시):

employees.txt:

1 John Doe
2 Jane Smith
3 Bob Johnson
...

departments.txt:

1 Sales
2 Marketing
3 Engineering
...

employee_departments.txt에 저장될 예상 출력 결과 (간략화된 예시):

Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...

요약

이번 챌린지에서는 50 명의 직원으로 구성된 대규모 데이터셋을 다루며 리눅스의 joinawk 명령어의 강력한 조합을 경험해 보았습니다. 서로 다른 두 파일의 데이터를 결합하고, awk로 가공하며, 결과를 정렬함으로써 유용한 형태의 정보를 생성했습니다. 이 실습은 데이터 조작이나 시스템 관리에서 흔히 발생하는 '여러 소스의 데이터를 효율적으로 통합하고 처리하는 방법'을 잘 보여줍니다. 특히 데이터의 규모가 커질수록 수동 작업은 시간이 오래 걸리고 오류가 발생하기 쉽기 때문에, 이러한 명령줄 도구를 활용한 자동화가 얼마나 중요한지 체감할 수 있었을 것입니다.

✨ 솔루션 확인 및 연습