Introdução
No ecossistema de utilitários de linha de comando do Linux, o join e o awk são ferramentas robustas que podem ampliar significativamente suas capacidades de processamento de dados. Este desafio testará sua habilidade em utilizar esses comandos de forma eficaz para processar e consolidar informações provenientes de múltiplas fontes, lidando com um conjunto de dados considerável que exige automação.
Combinando e Processando Dados
Tarefas
- Utilize o comando
joinpara combinar os dados de dois arquivos:employees.txtedepartments.txt. - Processe os dados combinados usando
awkpara gerar uma saída formatada. - Ordene o resultado final em ordem alfabética pelo sobrenome do funcionário.
Requisitos
- Todas as operações devem ser executadas no diretório
~/project. - Use o comando
joinpara unir as informações deemployees.txtedepartments.txt. - Utilize o
awkpara a formatação da saída. - O resultado final deve ser salvo em um arquivo chamado
employee_departments.txt. - A saída deve estar em ordem alfabética baseada no sobrenome (last name) do funcionário.
Exemplo
Arquivos de entrada (truncados para brevidade):
employees.txt:
1 John Doe
2 Jane Smith
3 Bob Johnson
...
departments.txt:
1 Sales
2 Marketing
3 Engineering
...
Saída esperada em employee_departments.txt (truncada para brevidade):
Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...
Resumo
Neste desafio, você explorou a poderosa combinação dos comandos join e awk no Linux, trabalhando com um conjunto de dados real de 50 funcionários. Ao unir dados de dois arquivos distintos, processá-los com awk e ordenar os resultados, você criou uma saída formatada que consolida informações de maneira útil. Este exercício demonstra como essas ferramentas podem ser empregadas para processar e combinar dados de múltiplas fontes com eficiência, uma tarefa cotidiana em manipulação de dados e administração de sistemas. A escala dos dados neste desafio reforça a importância do uso de ferramentas de linha de comando para automação, visto que o processamento manual seria demorado e passível de erros.



