Обработка данных о сотрудниках

LinuxBeginner
Практиковаться сейчас

Введение

В экосистеме утилит командной строки Linux команды join и awk являются мощными инструментами, способными значительно расширить ваши возможности по обработке данных. Данное испытание проверит ваше умение эффективно использовать эти команды для объединения и обработки информации из различных источников, работая с набором данных, требующим автоматизации.

Объединение и обработка данных

Задачи

  1. Используйте команду join для объединения данных из двух файлов: employees.txt и departments.txt.
  2. Обработайте объединенные данные с помощью awk для создания отформатированного вывода.
  3. Отсортируйте результат в алфавитном порядке по фамилии сотрудника.

Требования

  • Все операции должны выполняться в директории ~/project.
  • Для слияния данных из employees.txt и departments.txt используйте команду join.
  • Для форматирования вывода используйте awk.
  • Итоговый результат должен быть сохранен в файл с именем employee_departments.txt.
  • Вывод должен быть отсортирован по алфавиту на основе фамилии сотрудника.

Пример

Входные файлы (сокращено для примера):

employees.txt:

1 John Doe
2 Jane Smith
3 Bob Johnson
...

departments.txt:

1 Sales
2 Marketing
3 Engineering
...

Ожидаемое содержимое employee_departments.txt (сокращено для примера):

Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...
✨ Проверить решение и практиковаться

Резюме

В ходе этого испытания вы изучили мощную комбинацию команд join и awk в Linux, работая с реальным набором данных из 50 сотрудников. Объединив данные из двух разных файлов, обработав их с помощью awk и отсортировав результаты, вы создали структурированный отчет, объединяющий разрозненную информацию в удобном виде. Это упражнение наглядно показывает, как данные инструменты позволяют эффективно обрабатывать и консолидировать информацию из нескольких источников — это типичная задача в области манипуляции данными и системного администрирования. Масштаб данных в этом задании подчеркивает важность использования инструментов командной строки для автоматизации, так как ручная обработка была бы трудоемкой и чревата ошибками.