viernes, 17 de febrero de 2012

Backups usando RSYNC

Introducción.

rsync es una de esas pequeñas maravillas en el arsenal de los administradores de Linux. Aunque se le puede dar muchos usos, aquí voy a centrarme en las copias de seguridad.

En el trabajo, tengo varios terabytes de información repartidos en servidores de la red local e Internet. He probado varias soluciones de backup. Algunas me daban problemas con los nombres de archivo, otras no podían conectarse a los servidores externos o no funcionaban en Linux o en Windows. A la mayoría les costaba manejar esa cantidad de información, y podían tardar días en actualizar la copia de seguridad.

rsync es la solución más eficiente que he encontrado. En una o dos horas, es capaz de mantener la copia de seguridad actualizada, así que lo que antes eran copias de seguridad semanales, ahora son diarias. Ahorra ancho de banda al trasferir ficheros por Internet, y a veces es capaz de actualizar sólo la parte del fichero que ha cambiado. Encima gratuito, claro.

Vamos a ver cómo funciona.

Instalación.

apt-get install rsync

Uso básico.

El ejemplo más simple de uso de rsync sería:

rsync -av /home/jose/datos /mnt/disco_usb

Eso copiaría el directorio /home/jose/datos dentro del directorio /mnt/disco_usb. El destino podría ser un sistema de ficheros montado previamente o no ... para rsync, son dos sistemas de ficheros locales.

La opción -a activa el "modo archivador", lo que significa que hará una copia recursiva lo más fiel posible al origen. La opción -v hará que imprima los nombres de los ficheros que copia.

rsync permite hacer copias entre dos sistemas de ficheros locales, o entre un sistema de ficheros local y uno remoto. Hay dos formas de conectarse a un sistema remoto: a través de SSH o conectándose a un demonio RSYNC.

Para conectarse a un demonio RSYNC, previamente hay que configurarlo.Básicamente, hay que editar el fichero rsyncd.conf en la máquina remota, y luego conectarse al módulo correspondiente.

Yo personalmente prefiero conectarme por SSH. La sintaxis es la siguiente:

rsync -avz jose@192.168.0.50:/home/jose/datos /mnt/disco_usb

La orden anterior se conectará a la máquina 192.168.0.50 con el usuario jose, pedirá una clave, y copiará /home/jose/datos a nuestra carpeta local /mnt/disco_hd

La opción -z activará la compresión de datos. Comprimir los datos ahorra ancho de banda a cambio de un mayor tiempo de procesador; es una opción útil para pasar datos a través de Internet, pero no tanto a través de una red local.

Como ya he dicho, uno de los dos sistemas de ficheros tiene que ser local. Rsync no permite, por ejemplo, copiar ficheros entre dos conexiones ssh. Sin embargo, nada te impide montar un sistema de ficheros de red (CIFS, ntfs, shfs...) y hacer copia entre ellos. Rsync considerará estos sistemas locales.

Sincronizando sistemas de ficheros.

Bueno, lo que hemos visto hasta ahora no tiene nada de novedoso ... parece que rsync es como un cp -r o un rcp.

La diferencia fundamental es que rsync no sólo copia, sino que sincroniza los dos directorios y todas sus subcarpetas. Nuestro ejemplo anterior...

rsync -avz jose@192.168.0.50:/home/jose/datos /mnt/disco_usb

... se comporta de la siguiente manera:

. Si el fichero no existe en el destino, lo copia.
. Si el fichero existe en destino y ha sido modificado en origen, lo sobreescribe.
. Si el fichero existe en destino y no ha sido modificado en origen, no hace nada.
. Si el fichero ha sido borrado en origen y existe en destino, lo deja tal cual.

La gracia está en el punto tres. La primera vez que ejecutemos la orden, rsync copiará todos los ficheros. Las siguientes veces, sólo copiará los ficheros nuevos o los que hayan sido modificados. Eso supone un ahorro tremendo de tiempo y ancho de banda.

Copias de seguridad.

Con la funcionalidad básica que hemos visto arriba podemos hacer copias de seguridad algo chapuceras. Si un fichero se modifica, las modificaciones reescribirán cualquier versión anterior. Si un fichero se borra, permanecerá indefinidamente en la copia de seguridad (que irá engordando con el tiempo). Sólo necesitamos un par de opciones más para pulir este comportamiento.

La opción --delete borra los ficheros en destino que no se encuentren en el origen. Así, cuando en el directorio de datos se borre un fichero, también desaparecerá de nuestra copia de seguridad. De esa forma, nuestra copia será una imagen exacta de nuestros datos. En general es una buena cosa, pero también queremos mantener un histórico.

Las opciones --backup y --backup-dir  son las últimas que necesitamos. La primera le dice a rsync que antes de sobrescribir o borrar un fichero, debe hacer una copia de seguridad. La segunda le dice en qué directorio debe hacerla.

Ejemplo de copia de seguridad funcional.

Vamos a poner un ejemplo. Fíjate en la siguiente orden:

rsync -av --delete --backup --backup-dir=historico/cambios-`date +%d-%m-%y` admin@192.168.1.15:/share/MD0_DATA/datos /share/MD0_DATA/datos/qnap1

Cuando ejecutes esta orden en la línea de comandos, el intérprete de ordenes expandirá `date +%d-%m-%y` por la fecha actual. Es decir, si lo ejecutas el 5 de febrero, la orden que se ejecutará será

rsync -av --delete --backup --backup-dir=historico/cambios-5-2-2012 admin@192.168.1.15:/share/MD0_DATA/datos /share/MD0_DATA/datos/qnap1

... y si lo ejecutas el día 6 será

rsync -av --delete --backup --backup-dir=historico/cambios-6-2-2012 admin@192.168.1.15:/share/MD0_DATA/datos /share/MD0_DATA/datos/qnap1

Es decir, se creará un directorio de backup por cada día que ejecutes rsync.


¿Que va a hacer esta orden? Se va a conectar a la máquina 192.168.1.15 con el usuario admin, y va a sincronizar el directorio /share/MD0_DATA/datos con el directorio local  /share/MD0_DATA/datos/qnap1 Exactamente se va a comportar así:

. Si el fichero no existe en el destino, lo va a copiar.
. Si el fichero existe en el destino, pero no ha sido modificado en origen, no hará nada.
. Si el fichero existe en el destino y ha sido modificado, creará una copia de seguridad en el directorio correspondiente al día y lo sobreescribirá.
. Si el fichero ha sido borrado en origen, creará una copia de seguridad en el directorio correspondiente al día y lo borrará en destino.

¿Cómo quedará nuestra copia de seguridad? Veamos...

[~] # ls  /share/MD0_DATA/datos/qnap1
datos/     historico/

En el directorio datos tenemos una copia exacta de nuestros datos. Está la última versión de cada fichero, y si un fichero ha sido borrado en la carpeta de datos, habrá sido borrado de la copia de seguridad. Pero ....

[~] # ls  /share/MD0_DATA/datos/qnap1/historico/
cambios-13-02-12/ cambios-16-02-12/ cambios-31-01-12/
cambios-14-02-12/ cambios-17-02-12/
cambios-15-02-12/ cambios-30-01-12/

¡Ajam! Aquí está nuestro histórico. En estas carpetas están todos los ficheros borrados o modificados. Si un fichero se cambió el día 17, tendremos una copia actual en la carpeta  datos, y una copia de la versión anterior en historico/cambios-16-02-12 Si un fichero fue borrado, desaparecerá de la carpeta de datos, pero tendremos nuestro respaldo en la carpeta del histórico correspondiente.

Dependiendo del espacio de almacenamiento disponible tendremos que ir borrando carpetas históricas. Una simple orden find puede hacer el trabajo.

Espero que el artículo te resulte útil :)