La replicación de datos es el proceso de hacer múltiples copias de los datos y almacenarlas en diferentes ubicaciones con fines de respaldo, tolerancia a fallos y para mejorar su accesibilidad general a través de una red. De forma similar al mirroring de datos, la replicación de datos se puede aplicar tanto a equipos individuales como a servidores. Las réplicas de datos se pueden almacenar dentro del mismo sistema, en hosts locales y externos, y en hosts basados en la nube.
Las tecnologías de bases de datos más comunes hoy en día tienen funciones integradas o utilizan herramientas de terceros para llevar a cabo la replicación de datos. Mientras que las bases de datos Oracle y Microsoft SQL soportan activamente la replicación de datos, algunas tecnologías tradicionales pueden no incluir esta función out-of-the-box.
La replicación de datos puede ser sincrónica, lo que significa que se replicará cualquier cambio realizado en los datos originales, o asincrónica, lo que significa que la replicación sólo se inicia cuando se pasa la sentencia Commit a la base de datos.
Aunque la replicación de datos puede suponer un gran esfuerzo en términos de costos y requisitos informáticos y de almacenamiento, las empresas utilizan ampliamente esta técnica de gestión de bases de datos para lograr uno o varios de los siguientes objetivos:
Cuando un sistema concreto experimenta un fallo técnico debido a un malware o a un componente de hardware defectuoso, se puede seguir accediendo a los datos desde un sitio o nodo diferente. La replicación de datos mejora la resiliencia y fiabilidad de los sistemas almacenando los datos en varios nodos de la red.
En las organizaciones en las que hay varias sucursales repartidas por todo el mundo, los usuarios pueden experimentar cierta latencia al acceder a los datos de un país a otro. Colocar réplicas en servidores locales proporciona a los usuarios un acceso a los datos más rápido y unos tiempos de ejecución más cortos.
La replicación de bases de datos reduce efectivamente la carga del servidor primario dispersándola entre otros nodos del sistema distribuido, lo que mejora el rendimiento de red. Al dirigir todas las operaciones de lectura a una base de datos de réplica, los administradores de TI pueden reservar el servidor primario para las operaciones de escritura que exigen más capacidad de procesamiento.
Las empresas a menudo son susceptibles de sufrir pérdidas de datos debido a una violación de la seguridad de los datos o a un mal funcionamiento del hardware. Durante una catástrofe de este tipo, los valiosos datos de los empleados, junto con la información de los clientes, pueden verse comprometidos. La replicación de datos facilita la recuperación de los datos que se pierden o se corrompen manteniendo respaldos precisos en ubicaciones bien monitoreadas, lo que contribuye a mejorar la protección de los datos.
Las aplicaciones actuales utilizan una base de datos distribuida en el back-end, donde los datos se almacenan y procesan utilizando un clúster de sistemas, en lugar de depender de un sistema concreto para ello.
Supongamos que un usuario de una aplicación desea escribir un dato en la base de datos. Estos datos se dividen en múltiples fragmentos, y cada fragmento se almacena en un nodo diferente del sistema distribuido. La tecnología de bases de datos también se encarga de reunir y consolidar los distintos fragmentos cuando un usuario quiere recuperar o leer los datos.
En una disposición de este tipo, un único fallo del sistema puede impedir que se recupere la totalidad de los datos. Aquí es donde la replicación de datos resulta útil. La tecnología de replicación de datos puede almacenar múltiples fragmentos en cada nodo para optimizar las operaciones de lectura y escritura a través de la red.
Las herramientas de replicación de datos garantizan que los datos completos puedan seguir consolidándose desde otros nodos a través del sistema distribuido durante un fallo del sistema.
Dependiendo de las herramientas de replicación de datos empleadas, existen múltiples tipos de replicación que las empresas utilizan actualmente. Algunos de los modos de replicación más populares son los siguientes
La replicación de tabla completa significa que se replican todos los datos. Esto incluye los datos nuevos, actualizados y también los ya existentes que se copian del origen al destino. Este método de replicación suele asociarse a un mayor costo, ya que tiene un alto requisito de potencia de procesamiento y ancho de banda de la red.
Sin embargo, la replicación de tabla completa puede ser beneficiosa para recuperar los datos borrados de forma permanente, así como los datos que no poseen claves de replicación —de lo que hablaremos más adelante en este artículo—.
En este método, el software de replicación de datos realiza copias iniciales completas de los datos desde el origen hasta el destino, tras lo cual la base de datos del suscriptor recibe actualizaciones cada vez que se modifican los datos. Este es un modo de replicación más eficiente, ya que se copian menos filas cada vez que se modifican los datos. La replicación transaccional suele encontrarse en entornos de servidor a servidor.
En la replicación de instantáneas, los datos se replican exactamente tal y como aparecen en cada momento. A diferencia de otros métodos, la replicación de instantáneas no presta atención a los cambios realizados en los datos. Este modo de replicación se utiliza cuando los cambios realizados en los datos tienden a ser poco frecuentes; por ejemplo, realizando sincronizaciones iniciales entre editores y suscriptores
Este tipo de replicación es habitual en entornos de servidor a cliente y permite que tanto el editor como el suscriptor realicen cambios en los datos de forma dinámica. En la replicación de mezcla, los datos de dos o más bases de datos se combinan para formar una única base de datos, lo aumenta la complejidad de usar esta técnica.
También denominada registro incremental de datos basado en claves, esta técnica sólo copia los datos modificados desde la última actualización. Las claves se pueden considerar como elementos que existen dentro de las bases de datos que disparan la replicación de datos. Dado que en cada actualización sólo se copian unas pocas filas, los costos son significativamente bajos.
Sin embargo, el inconveniente reside en que este modo de replicación no se puede utilizar para recuperar los datos borrados de forma permanente, ya que el valor de la clave también se borra junto con el registro.
La replicación de datos en DBMS (servidores de distribución) se puede llevar a cabo utilizando un esquema de replicación adecuado. Los esquemas de replicación ampliamente adoptados son los siguientes:
La replicación completa significa que toda la base de datos se replica en cada sitio del sistema distribuido. Este esquema maximiza la disponibilidad de los datos y la redundancia en una red de área amplia.
Por ejemplo, los usuarios de una red transfronteriza tienen acceso a la base de datos completa desde un servidor con sede en Asia si el servidor de Europa o Norteamérica experimenta una dificultad técnica.
La replicación completa también contribuye a una ejecución más rápida de las consultas globales, ya que los resultados pueden obtenerse de cualquier servidor local. La desventaja de la replicación completa es que el proceso de actualización tiende a ser más lento. Esto hace que mantener copias actualizadas de los datos en cada ubicación sea todo un reto.

La replicación parcial se produce cuando sólo se replican determinados fragmentos de la base de datos según la importancia de los datos en cada ubicación. Aquí, el número de copias puede oscilar entre uno y el número total de nodos del sistema distribuido.
En un entorno empresarial, este modo de replicación puede ser útil para los miembros de equipos de ventas y marketing en los que se almacena una base de datos parcial en computadores personales y se sincroniza regularmente con el servidor principal.

En este modo de replicación, sólo existe un fragmento en cada sitio del sistema distribuido. Aunque la ausencia de replicación puede atribuirse a la facilidad de recuperación de datos, puede tener un efecto adverso en la velocidad de ejecución de las consultas, ya que varios usuarios acceden al mismo servidor. En comparación con otros esquemas de replicación, la no replicación de datos en DBMS proporciona una escasa disponibilidad de los datos.

Device Control Plus es una solución de seguridad de ManageEngine que impide que los dispositivos extraíbles, como memorias USB o unidades de memoria USB, obtengan acceso no autorizado a los nodos de un sistema distribuido. Los dispositivos de almacenamiento extraíbles son un peligro latente para la seguridad de los datos en una organización, así como para la privacidad de la información personal de clientes y empleados.
Además, los sistemas críticos de su entorno de producción están sujetos a ataques internos para obtener beneficios personales o profesionales. Cada vez que se modifican o copian archivos en dispositivos USB, Device Control Plus copia el archivo original en un recurso de red protegido por contraseña que facilita la recuperación en caso de violación de la seguridad de los datos.

Device Control Plus incluye una función de copia shadow de archivos que protege los datos vitales de su red. Seleccione los endpoints para activar la replicación de archivos, establezca los límites de tamaño y extensión de los archivos, configure la ruta compartida remota y ya está listo para proteger su empresa del riesgo de pérdida de datos. ¡Descargue su prueba gratis por 30 días hoy mismo!