Extraindo Informações de Texto

LinuxBeginner
Pratique Agora

Introdução

Neste projeto, você aprenderá como extrair URLs de imagens de arquivos Markdown usando um script Bash. Esta é uma tarefa comum ao trabalhar com documentação técnica, pois permite identificar e recuperar rapidamente as imagens usadas em um documento.

👀 Pré-visualização

$ ./getimage.sh labex_lab1.md
https://doc.shiyanlou.com/document-uid13labid292timestamp14677222211211.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14672311234511.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14677029556772.png

🎯 Tarefas

Neste projeto, você aprenderá:

  • Como criar um script Bash para extrair URLs de imagens de um arquivo Markdown
  • Como tornar o script executável e executá-lo a partir da linha de comando
  • Como personalizar o script para salvar as URLs extraídas em um arquivo

🏆 Conquistas

Após concluir este projeto, você será capaz de:

  • Automatizar o processo de extração de URLs de imagens de arquivos Markdown
  • Incorporar este script em seu fluxo de trabalho ao trabalhar com documentação técnica
  • Personalizar o script para atender às suas necessidades e requisitos específicos

Extrair URLs de Imagens do Arquivo Markdown

Nesta etapa, você aprenderá como extrair todas as URLs de imagens de um arquivo Markdown usando um script Bash.

  1. Abra um editor de texto e crie um novo arquivo chamado getimage.sh.
  2. Adicione o seguinte código ao arquivo:
#!/bin/bash

## Extract image URL
image_urls=$(grep -o "\!\[.*]\(.*\)" "$1" | sed -E "s/(\!\[.*]\()(.+)(.*\))/\2/g")

## Print image URL
echo "$image_urls"

Este script usa o comando grep para encontrar todas as linhas no arquivo Markdown que contêm links de imagens e, em seguida, usa o comando sed para extrair a URL de cada linha.

Executar o Script

Agora que você criou o script getimage.sh, você pode executá-lo para extrair as URLs de imagens de um arquivo Markdown.

  1. Abra um terminal e navegue até o diretório onde você salvou o script getimage.sh.
  2. Execute o script com o caminho para o arquivo Markdown como um argumento:
./getimage.sh /home/labex/project/labex_lab1.md

Isso exibirá todas as URLs de imagens encontradas no arquivo labex_lab1.md, uma por linha.

Por exemplo, a saída pode ser semelhante a esta:

https://doc.shiyanlou.com/document-uid13labid292timestamp14677222211211.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14672311234511.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14677029556772.png

Resumo

Parabéns! Você concluiu este projeto. Você pode praticar mais laboratórios no LabEx para aprimorar suas habilidades.

✨ Verificar Solução e Praticar✨ Verificar Solução e Praticar