Implementación de Resiliencia de Datos: Copias de Seguridad e Integridad de Archivos

CompTIABeginner
Practicar Ahora

Introducción

En el mundo de la computación, los datos son invaluables. La pérdida de datos, ya sea por fallo de hardware, eliminación accidental o ataques maliciosos, puede ser catastrófica. La resiliencia de datos es la práctica de asegurar que sus datos estén protegidos, disponibles y puedan ser recuperados en caso de un fallo.

Este laboratorio le introducirá a dos conceptos fundamentales de la resiliencia de datos en sistemas Linux: la creación de copias de seguridad (backups) y la verificación de la integridad de los archivos. Utilizará herramientas estándar de línea de comandos de Linux para realizar estas tareas.

Aprenderá a:

  • Utilizar el comando tar para crear un archivo comprimido (copia de seguridad) de archivos importantes.
  • Simular un escenario de pérdida de datos eliminando archivos.
  • Restaurar sus datos desde el archivo de copia de seguridad.
  • Utilizar sumas de verificación (checksums) con md5sum para verificar que sus archivos no han sido alterados o corrompidos.

Al final de este laboratorio, tendrá experiencia práctica y directa con habilidades esenciales para cualquier administrador de sistemas o desarrollador.

Este es un Guided Lab, que proporciona instrucciones paso a paso para ayudarte a aprender y practicar. Sigue las instrucciones cuidadosamente para completar cada paso y obtener experiencia práctica. Los datos históricos muestran que este es un laboratorio de nivel principiante con una tasa de finalización del 100%. Ha recibido una tasa de reseñas positivas del 100% por parte de los estudiantes.

Crear una Copia de Seguridad Local de Archivos Críticos con Tar

En este paso, aprenderá a crear una copia de seguridad comprimida de un directorio utilizando la utilidad tar (Tape Archive). tar es un comando potente y ampliamente utilizado para agrupar archivos y directorios en un único archivo de archivo, que luego puede comprimirse para ahorrar espacio. Este es un método común para crear copias de seguridad locales.

Primero, verifiquemos los archivos que el script de configuración creó para usted. Todo su trabajo se realizará en el directorio ~/project.

Liste el contenido del directorio ~/project:

ls -R ~/project

Debería ver el directorio critical_data con sus archivos y un directorio backups vacío.

/home/labex/project:
backups  critical_data

/home/labex/project/backups:

/home/labex/project/critical_data:
config.txt  user_data.csv

Ahora, creemos una copia de seguridad comprimida del directorio critical_data y la almacenaremos en el directorio backups. Utilizaremos el comando tar con las siguientes opciones:

  • c: Crear un nuevo archivo.
  • z: Comprimir el archivo con gzip. Por eso el archivo tendrá la extensión .gz.
  • v: Modo verboso. Liste los archivos a medida que se procesan.
  • f: Especifica el nombre del archivo a crear.
  • -C: Cambiar al directorio especificado antes de crear el archivo. Esto asegura que almacenamos rutas relativas en lugar de rutas absolutas, haciendo la copia de seguridad más portable y evitando estructuras de directorios anidadas durante la extracción.

Ejecute el siguiente comando en su terminal:

tar -czvf ~/project/backups/backup.tar.gz -C ~/project critical_data

El comando mostrará los nombres de los archivos que está agregando al archivo:

critical_data/
critical_data/config.txt
critical_data/user_data.csv

Ahora ha creado exitosamente una copia de seguridad. Para estar seguro, puede listar el contenido del directorio backups:

ls ~/project/backups

Debería ver su nuevo archivo de copia de seguridad:

backup.tar.gz

Simular Pérdida de Datos y Restaurar desde Copia de Seguridad

En este paso, simulará un escenario de desastre común: la eliminación accidental de datos. Luego, utilizará el archivo de copia de seguridad que creó en el paso anterior para restaurar los datos perdidos.

Primero, simulemos la pérdida de datos eliminando permanentemente el directorio critical_data. El comando rm -rf es muy potente y debe usarse con precaución; elimina directorios y archivos de forma recursiva (-r) y forzada (-f) sin pedir confirmación.

Ejecute el siguiente comando para eliminar el directorio:

rm -rf ~/project/critical_data

Ahora, verifique que el directorio ha desaparecido listando el contenido de su directorio de proyecto:

ls ~/project

Verá que el directorio critical_data ya no está allí:

backups

¡No se preocupe! Por eso tenemos copias de seguridad. Ahora, restauremos el directorio desde el archivo backup.tar.gz. Usaremos el comando tar nuevamente, pero con opciones diferentes:

  • x: Extraer archivos de un archivo.
  • z: Descomprimir el archivo con gzip.
  • v: Modo verboso, para ver los archivos a medida que se extraen.
  • f: Especifica el nombre del archivo a utilizar.
  • -C: Especifica el directorio al que extraer los archivos. Los extraeremos en ~/project.

Ejecute este comando para restaurar sus datos:

tar -xzvf ~/project/backups/backup.tar.gz -C ~/project

Verá la salida de los archivos que se están extrayendo:

critical_data/
critical_data/config.txt
critical_data/user_data.csv

Observe que tar conservó la estructura original del directorio, pero sin los prefijos de ruta absoluta, ya que usamos la opción -C durante la creación de la copia de seguridad. Verifiquemos que la restauración fue exitosa. Liste el contenido del directorio ~/project nuevamente:

ls -R ~/project

Debería ver que el directorio critical_data y todos sus archivos originales han sido restaurados.

/home/labex/project:
backups  critical_data

/home/labex/project/backups:
backup.tar.gz

/home/labex/project/critical_data:
config.txt  user_data.csv

Ha recuperado exitosamente de un evento simulado de pérdida de datos.

Monitorizar la Integridad de Archivos con Sumas de Verificación (Checksums)

En este paso, aprenderá a monitorizar la integridad de los archivos. Una copia de seguridad lo protege de la pérdida de datos, pero no le dice si un archivo se ha corrompido sutilmente o ha sido alterado maliciosamente. Un checksum (o hash) es una huella digital única de un archivo. Si cambia incluso un solo bit en el archivo, el checksum cambiará por completo. Esto lo convierte en una excelente herramienta para verificar la integridad de los archivos.

Utilizaremos el comando md5sum, que calcula un checksum MD5. Aunque SHA-256 (sha256sum) es criptográficamente más seguro, md5sum es simple y suficiente para esta demostración.

Primero, generemos checksums para nuestros archivos críticos y guardémoslos en un archivo de referencia.

md5sum ~/project/critical_data/* > ~/project/checksums.md5

Ahora, vea el contenido del archivo checksums.md5 que acaba de crear:

cat ~/project/checksums.md5

La salida mostrará un checksum único para cada archivo. Sus valores de checksum serán idénticos a estos:

d7118547a95c5470575962481c2e358c  /home/labex/project/critical_data/config.txt
b643407358b9de495715f13432577d33  /home/labex/project/critical_data/user_data.csv

Ahora, simulemos una modificación no autorizada en uno de los archivos. Añadiremos un comentario al archivo config.txt.

echo "## This is a change" >> ~/project/critical_data/config.txt

El archivo ha sido alterado. Para un observador que solo mire la lista de archivos, nada parece estar mal. Pero podemos usar nuestro archivo de checksums para verificar cambios. La opción -c le indica a md5sum que verifique los archivos contra una lista.

md5sum -c ~/project/checksums.md5

El comando verificará cada archivo listado en checksums.md5 contra su estado actual en el disco. La salida mostrará claramente que config.txt ha sido modificado:

/home/labex/project/critical_data/config.txt: FAILED
/home/labex/project/critical_data/user_data.csv: OK
md5sum: WARNING: 1 computed checksum did NOT match

Este estado "FAILED" le alerta inmediatamente de que el archivo ya no está en su estado original y de confianza. Esta es una técnica poderosa para detectar corrupción de datos o brechas de seguridad.

Resumen

¡Felicitaciones por completar este laboratorio! Ha adquirido experiencia práctica con prácticas fundamentales de resiliencia de datos en un entorno Linux.

En este laboratorio, ha aprendido a:

  • Crear Copias de Seguridad: Utilizó el comando tar para crear una copia de seguridad comprimida de archivos críticos, una habilidad fundamental para prevenir la pérdida de datos.
  • Restaurar Datos: Simuló un escenario de pérdida de datos y restauró con éxito sus archivos desde un archivo tar, demostrando un ciclo completo de copia de seguridad y recuperación.
  • Verificar la Integridad de Archivos: Utilizó md5sum para generar y verificar checksums de archivos, un método potente para detectar modificaciones no autorizadas o corrupción de datos.

Estas habilidades son esenciales para mantener la seguridad y disponibilidad de cualquier sistema. Realizar copias de seguridad de datos de forma regular y verificar su integridad son componentes cruciales de la administración responsable de sistemas y del despliegue de aplicaciones robustas.