Extraction d'URL d'images à partir de fichiers Markdown

Introduction

Dans ce projet, vous allez apprendre à extraire les URL d'images à partir de fichiers Markdown à l'aide d'un script Bash. C'est une tâche courante lorsqu'on travaille avec des documents techniques, car cela vous permet d'identifier rapidement et de récupérer les images utilisées dans un document.

👀 Aperçu

$./getimage.sh labex_lab1.md
https://doc.shiyanlou.com/document-uid13labid292timestamp14677222211211.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14672311234511.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14677029556772.png

🎯 Tâches

Dans ce projet, vous allez apprendre :

Comment créer un script Bash pour extraire les URL d'images à partir d'un fichier Markdown
Comment rendre le script exécutable et le lancer à partir de la ligne de commande
Comment personnaliser le script pour enregistrer les URL extraites dans un fichier

🏆 Réalisations

Après avoir terminé ce projet, vous serez capable de :

Automatiquer le processus d'extraction des URL d'images à partir de fichiers Markdown
Intégrer ce script dans votre flux de travail lorsqu'on travaille avec des documents techniques
Personnaliser le script pour répondre à vos besoins et exigences spécifiques

Extraire les URL d'images à partir d'un fichier Markdown

Dans cette étape, vous allez apprendre à extraire toutes les URL d'images à partir d'un fichier Markdown à l'aide d'un script Bash.

Ouvrez un éditeur de texte et créez un nouveau fichier nommé getimage.sh.
Ajoutez le code suivant au fichier :

#!/bin/bash

## Extract image URL
image_urls=$(grep -o "\!\[.*]\(.*\)" "$1" | sed -E "s/(\!\[.*]\()(.+)(.*\))/\2/g")

## Print image URL
echo "$image_urls"

Ce script utilise la commande grep pour trouver toutes les lignes dans le fichier Markdown qui contiennent des liens d'images, puis utilise la commande sed pour extraire l'URL de chaque ligne.

Exécuter le script

Maintenant que vous avez créé le script getimage.sh, vous pouvez l'exécuter pour extraire les URL d'images à partir d'un fichier Markdown.

Ouvrez un terminal et accédez au répertoire où vous avez enregistré le script getimage.sh.
Exécutez le script avec le chemin vers le fichier Markdown en tant qu'argument :

./getimage.sh /home/labex/project/labex_lab1.md

Cela affichera toutes les URL d'images trouvées dans le fichier labex_lab1.md, une par ligne.

Par exemple, la sortie pourrait ressembler à ceci :

https://doc.shiyanlou.com/document-uid13labid292timestamp14677222211211.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14672311234511.png
https://doc.shiyanlou.com/document-uid13labid292timestamp14677029556772.png

Résumé

Félicitations ! Vous avez terminé ce projet. Vous pouvez pratiquer d'autres laboratoires dans LabEx pour améliorer vos compétences.

Extraction d'informations à partir de texte