Copias de seguridad: ¿Cómo evitar la pérdida masiva de datos?

Los fallos del disco duro son inevitables, pero la pérdida de datos no tiene que ser así. Una vez ocurrió que una estudiante graduada ejecutó lo que debería haber sido un comando de rutina en su terminal de Unix: rm −rf *. Ese comando le indica a la computadora que elimine todo el directorio actual
 
serman, laboratorio de recuperación de datos en españa

Los fallos del disco duro son inevitables, pero la pérdida de datos no tiene que ser así. Una vez ocurrió que una estudiante graduada ejecutó lo que debería haber sido un comando de rutina en su terminal de Unix: rm −rf *. Ese comando le indica a la computadora que elimine todo el directorio actual de forma recursiva, incluidos todos los subdirectorios. Solo había un problema: ella estaba en el directorio equivocado. Pero por suerte vive en un mundo con copias de seguridad.

En ese momento, estaba estudiando lingüística computacional como parte de una maestría en biología en la Universidad de California, Los Ángeles. Había pasado meses desarrollando y ejecutando software de simulación, y por fin estaba lista para comenzar su análisis. El primer paso fue “limpiar los datos y organizarse”, dice ella. En su lugar, eliminó todo su proyecto. Y, a diferencia de la red de seguridad que ofrecen los botes de basura de los sistemas operativos Windows y Macintosh, no hay forma de recuperarse de la ejecución de rm. A menos que tengas una copia de seguridad.

Las copias hoy en día:

En el mundo digital, la copia de seguridad de los datos es esencial, ya sea que se trate de selfies de teléfonos inteligentes o conjuntos de datos masivos de secuenciación del genoma. Los medios de almacenamiento son frágiles e inevitablemente fallan, se pierden, son robados o dañados.

Las opciones de copia de seguridad van desde dispositivos de memoria USB y servicios de almacenamiento de datos basados en la nube hasta enormes servidores institucionales de cinta magnética, y los investigadores suelen explotar más de uno. Pero no todas estas estrategias tienen las mismas ventajas, y los científicos deben descubrir qué funciona mejor para ellos en función de la naturaleza y el volumen de sus datos, la disponibilidad de recursos de almacenamiento y las preocupaciones sobre la privacidad de los datos.

En este caso, la automatización salvó el día. La copia de seguridad del servidor en el que trabajaba estaba en la cinta, y las “personas de TI muy amigables y serviciales” en el departamento de soporte informático de ciencias de la vida de su departamento pudieron recuperar sus archivos. Pero la situación fue particularmente embarazosa, dice, porque ahora es directora ejecutiva de The Carpentries, una organización sin fines de lucro en San Francisco, California, que dirige talleres sobre computación científica. Era “como el salvavidas que tiene que ser rescatado”, dice ella.

Aquí hay un par de consejos que podrían hacer que los posibles desastres por pérdida de datos sean un poco menos dolorosos.

Aplicar la regla 3-2-1.

La regla de oro a seguir al realizar copias de seguridad de datos es ‘3-2-1’: “Son tres copias, en dos medios y uno fuera del sitio. Puede, por ejemplo, mantener respaldos en su computadora personal, un disco duro externo y el servicio de sincronización de archivos basado en la nube Dropbox. Esta es una rúbrica para inspirarse, no una ley, los datos valiosos pueden requerir precauciones adicionales.

Hablar con los especialistas.

Su institución emplea a personas para que piensen en los datos a tiempo completo, así que hable con ellos. El centro de investigación y computación podría ofrecer sistemas de respaldo institucionales gratuitos o de bajo costo; su bibliotecario puede ayudarlo a elaborar una estrategia de gestión de datos; y la oficina de subvenciones puede aconsejarle sobre los requisitos de la agencia de financiamiento, incluida la forma en que se deben mantener los datos y durante cuánto tiempo.

Gestiona tus datos

Las copias de seguridad confiables requieren una gestión de datos inteligente. Analice sus datos: ¿Este archivo necesita, o es suficientemente valioso, para ser almacenado?

Establezca convenciones sobre nombres y organización de archivos, por ejemplo, que cada proyecto tenga su propia carpeta; que los datos y el código van a subdirectorios dedicados; y que cada carpeta del proyecto incluye un archivo que documenta los objetivos, métodos, metadatos y archivos del proyecto. Planifique dónde y cómo se realiza la copia de seguridad de los datos, y desarrolle un programa, diario o semanal, por ejemplo, para hacerlo.

Los datos sin procesar siempre deben guardarse, pero los archivos de procesamiento intermedio a menudo se pueden descartar. Los conjuntos de datos masivos requieren una reflexión especial: algunos proveedores basados en la nube limitan el tamaño de los archivos almacenados, y los costos de almacenamiento y transferencia de datos pueden volverse prohibitivos.

serman, laboratorio de recuperación de datos en españa
 

Los comentarios están cerrados.