Processamento de Dados de Funcionários

LinuxBeginner
Pratique Agora

Introdução

No ecossistema de utilitários de linha de comando do Linux, o join e o awk são ferramentas robustas que podem ampliar significativamente suas capacidades de processamento de dados. Este desafio testará sua habilidade em utilizar esses comandos de forma eficaz para processar e consolidar informações provenientes de múltiplas fontes, lidando com um conjunto de dados considerável que exige automação.

Combinando e Processando Dados

Tarefas

  1. Utilize o comando join para combinar os dados de dois arquivos: employees.txt e departments.txt.
  2. Processe os dados combinados usando awk para gerar uma saída formatada.
  3. Ordene o resultado final em ordem alfabética pelo sobrenome do funcionário.

Requisitos

  • Todas as operações devem ser executadas no diretório ~/project.
  • Use o comando join para unir as informações de employees.txt e departments.txt.
  • Utilize o awk para a formatação da saída.
  • O resultado final deve ser salvo em um arquivo chamado employee_departments.txt.
  • A saída deve estar em ordem alfabética baseada no sobrenome (last name) do funcionário.

Exemplo

Arquivos de entrada (truncados para brevidade):

employees.txt:

1 John Doe
2 Jane Smith
3 Bob Johnson
...

departments.txt:

1 Sales
2 Marketing
3 Engineering
...

Saída esperada em employee_departments.txt (truncada para brevidade):

Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...
✨ Verificar Solução e Praticar

Resumo

Neste desafio, você explorou a poderosa combinação dos comandos join e awk no Linux, trabalhando com um conjunto de dados real de 50 funcionários. Ao unir dados de dois arquivos distintos, processá-los com awk e ordenar os resultados, você criou uma saída formatada que consolida informações de maneira útil. Este exercício demonstra como essas ferramentas podem ser empregadas para processar e combinar dados de múltiplas fontes com eficiência, uma tarefa cotidiana em manipulação de dados e administração de sistemas. A escala dos dados neste desafio reforça a importância do uso de ferramentas de linha de comando para automação, visto que o processamento manual seria demorado e passível de erros.