직원 데이터 처리하기

LinuxBeginner
지금 연습하기

소개

리눅스 명령줄 유틸리티의 세계에서 joinawk는 데이터 처리 능력을 크게 향상시킬 수 있는 강력한 도구입니다. 이번 챌린지에서는 자동화가 필요한 대규모 데이터셋을 다루며, 여러 소스의 데이터를 효과적으로 결합하고 처리하는 능력을 테스트합니다.

이 콘텐츠는 가이드 랩과 달리, 제공되는 단계를 따라가는 것이 아니라 스스로 과제를 완수해야 하는 챌린지입니다. 챌린지는 다소 난이도가 있을 수 있습니다. 해결이 어렵다면 Labby 와 상의하거나 모범 답안을 확인해 보세요. 통계에 따르면 이 챌린지는 초급 수준으로 98%의 통과율과 98%의 긍정적인 평가를 기록하고 있습니다.

데이터 결합 및 처리

과제

  1. join 명령어를 사용하여 employees.txtdepartments.txt 두 파일의 데이터를 결합하세요.
  2. awk를 사용하여 결합된 데이터를 처리하고 지정된 형식으로 출력하세요.
  3. 출력 결과를 직원의 성 (Last Name) 을 기준으로 알파벳순으로 정렬하세요.

요구 사항

  • 모든 작업은 ~/project 디렉토리 내에서 수행해야 합니다.
  • join 명령어를 사용하여 employees.txtdepartments.txt를 결합하세요.
  • awk를 사용하여 출력 형식을 지정하세요.
  • 최종 결과물은 employee_departments.txt라는 파일로 저장해야 합니다.
  • 출력 내용은 직원의 성 (Last Name) 을 기준으로 알파벳순 정렬되어야 합니다.

예시

입력 파일 (간략화된 예시):

employees.txt:

1 John Doe
2 Jane Smith
3 Bob Johnson
...

departments.txt:

1 Sales
2 Marketing
3 Engineering
...

employee_departments.txt에 저장될 예상 출력 결과 (간략화된 예시):

Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...
✨ 솔루션 확인 및 연습

요약

이번 챌린지에서는 50 명의 직원으로 구성된 대규모 데이터셋을 다루며 리눅스의 joinawk 명령어의 강력한 조합을 경험해 보았습니다. 서로 다른 두 파일의 데이터를 결합하고, awk로 가공하며, 결과를 정렬함으로써 유용한 형태의 정보를 생성했습니다. 이 실습은 데이터 조작이나 시스템 관리에서 흔히 발생하는 '여러 소스의 데이터를 효율적으로 통합하고 처리하는 방법'을 잘 보여줍니다. 특히 데이터의 규모가 커질수록 수동 작업은 시간이 오래 걸리고 오류가 발생하기 쉽기 때문에, 이러한 명령줄 도구를 활용한 자동화가 얼마나 중요한지 체감할 수 있었을 것입니다.