Extração de E-mails e Números

LinuxBeginner
Pratique Agora

Introdução

No mundo atual orientado a dados, a capacidade de extrair informações específicas de grandes conjuntos de dados de forma eficiente é crucial. Bob, um analista de dados em uma empresa de e-commerce em rápido crescimento, enfrenta um desafio comum: analisar extensos logs de clientes para extrair insights valiosos. Os logs contêm uma mistura de dados numéricos (representando IDs de clientes e valores de transações) e endereços de e-mail, juntamente com outras informações diversas.

Neste desafio, você assumirá o papel de Bob e usará expressões regulares para extrair e organizar essas informações vitais. Esta tarefa é essencial para os esforços de gestão de relacionamento com o cliente e análise de vendas da empresa. Ao dominar essas habilidades, você não apenas ajudará Bob, mas também se equipará com poderosas técnicas de manipulação de dados aplicáveis em várias áreas da tecnologia.

Extração de Dados

Bob precisa separar os dados numéricos e os endereços de e-mail do arquivo de log diário da empresa. Sua tarefa é usar expressões regulares para extrair essas informações do arquivo /home/labex/project/data.

Tarefas

  1. Combine as linhas que começam com um número e grave o resultado em /home/labex/project/num.
  2. Combine o formato correto de endereço de e-mail e grave o resultado em /home/labex/project/mail.

Requisitos

  1. Preste atenção ao formato dos endereços de e-mail, que podem variar (por exemplo, @gmail.com, @company.co.uk).
  2. Tenha cuidado com o tratamento de caracteres especiais, especialmente o ponto (.).
  3. Não modifique o conteúdo do arquivo data.

Exemplo

Conteúdo do arquivo num:

123
456
789
...

Conteúdo do arquivo mail:

2133131@gmail.com
3312313213@gmail.com
testfile@outlook.com
...

Resumo

Parabéns! Você concluiu o desafio com sucesso. Você aprendeu a usar expressões regulares com o comando grep para extrair dados específicos de um arquivo. Essa habilidade é crucial para a análise e processamento de dados em diversas tarefas de programação e administração de sistemas. Em um cenário real, isso pode otimizar significativamente os fluxos de trabalho de processamento de dados, economizando tempo e melhorando a precisão em projetos de análise de dados.

✨ Verificar Solução e Praticar