Procesamiento de datos de empleados

LinuxLinuxBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En el mundo de las utilidades de la línea de comandos de Linux, join y awk son herramientas poderosas que pueden mejorar en gran medida tus capacidades de procesamiento de datos. Este desafío pondrá a prueba tu capacidad para utilizar estos comandos de manera efectiva para procesar y combinar datos de múltiples fuentes, manejando un conjunto de datos considerable que requiere automatización.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL linux(("Linux")) -.-> linux/BasicFileOperationsGroup(["Basic File Operations"]) linux(("Linux")) -.-> linux/TextProcessingGroup(["Text Processing"]) linux/BasicFileOperationsGroup -.-> linux/cut("Text Cutting") linux/TextProcessingGroup -.-> linux/awk("Text Processing") linux/TextProcessingGroup -.-> linux/sort("Text Sorting") linux/TextProcessingGroup -.-> linux/join("File Joining") subgraph Lab Skills linux/cut -.-> lab-388132{{"Procesamiento de datos de empleados"}} linux/awk -.-> lab-388132{{"Procesamiento de datos de empleados"}} linux/sort -.-> lab-388132{{"Procesamiento de datos de empleados"}} linux/join -.-> lab-388132{{"Procesamiento de datos de empleados"}} end

Combinación y procesamiento de datos

Tareas

  1. Utiliza el comando join para combinar datos de dos archivos: employees.txt y departments.txt.
  2. Procesa los datos combinados utilizando awk para crear una salida formateada.
  3. Ordena la salida alfabéticamente por el apellido del empleado.

Requisitos

  • Todas las operaciones deben realizarse en el directorio ~/project.
  • Utiliza el comando join para combinar datos de employees.txt y departments.txt.
  • Utiliza awk para dar formato a la salida.
  • La salida final debe guardarse en un archivo llamado employee_departments.txt.
  • La salida debe ordenarse alfabéticamente por el apellido del empleado.

Ejemplo

Archivos de entrada (truncados por brevedad):

employees.txt:

1 John Doe
2 Jane Smith
3 Bob Johnson
...

departments.txt:

1 Sales
2 Marketing
3 Engineering
...

Salida esperada en employee_departments.txt (truncada por brevedad):

Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...
✨ Revisar Solución y Practicar

Resumen

En este desafío, has explorado la poderosa combinación de los comandos join y awk en Linux, trabajando con un conjunto de datos considerable de 50 empleados. Al unir datos de dos archivos separados, procesarlos con awk y ordenar los resultados, has creado una salida formateada que combina la información de manera útil. Este ejercicio demuestra cómo se pueden utilizar estos comandos para procesar y combinar eficientemente datos de múltiples fuentes, una tarea común en la manipulación de datos y la administración de sistemas. La escala de los datos en este desafío destaca la importancia de utilizar herramientas de línea de comandos para la automatización, ya que el procesamiento manual sería tedioso y propenso a errores.