© Josep Ros. Con la tecnología de Blogger.

Porqué prefiero cabinas sin deduplicación para vSphere

Se habla mucho de Deduplicación por cabina en entornos SAN de sistemas en producción con vSphere.

Yo creo que realmente no es nada importante y explico porqué.

Lo que realmente importa en un entorno virtual es que la cabina sea flexible, es decir, que no se nos quede pequeña en pocos meses y se pueda ampliar de caché y de disco. Queremos rendimiento en la cabina, que las VM vayan todo lo rápidas que puedan ir y que sea simple de gestionar.

La Deduplicación nos permite ahorrar un cierto espacio en el almacenamiento, ahora bien, hay que reservar una parte de la cabina para esos efectos. ¿Lo comido por lo servido? Aunque sea algo más el ahorro de la reserva, con sinceridad... no lo veo.

Si yo tengo una cabina que se pasa x horas de su ciclo de vida diario deduplicando, es tiempo que pierdo para que me haga réplicas de backup o para que simplemente los discos estén tranquilamente sin hacer nada.

Y qué gano? 600GB? 1TB? cada disco de 600GB SAS vale poco más de 600€

Sin embargo la deduplicación nos puede ralentizar el trabajo de la SAN en momentos en que precisemos de su funcionamiento a toda máquina. Incluso en algunos entornos el ciclo de deduplicación no finaliza por la noche y te encuentras a los usuarios trabajando a velocidad penosa porque la SAN deduplica...

Una capa más de complejidad, algo más que se puede fastidiar y podemos perder datos...

Prefiero no tener deduplicación en las SAN en producción.

Sin embargo para hacer copia de seguridad a disco sí que puede estar bien.

Es mi opinión y la quiero expresar claramente. Sé que muchos colegas prefieren deduplicación y lo respeto, por supuesto.

Me gustaría saber vuestra opinión. Gracias!

6 comentarios:

Dead dijo...

mmm, no lo se tengo un lucha interna con los sistemas de dedupliacion. Creo que particularmente que yo tanbien los prefiero unicamente para lo referente a backup.

Saludos

Josep Ros dijo...

Gracias por tu participación Dead. Al final se trata de argumentar nuestras inquietudes, y explicar porqué nos empatiza o no una tecnología, así ganamos todos.

Saludos!

Javier Martinez dijo...

Yo no uso deduplicacion para los servidores , ahora bien , la misma cabina (EMC) también dispone de un appliance (CELERRA) para servir ficheros via NAS ( CIFS) , en función de la cantidad de TB y el nº de usuarios de la misma compañía que lo usen, pude ahorrar bastante espacio en disco.

Donde hay un ahorro palpable es en el backup ya sea realizado en origen o en destino.

Para backup en origen, el producto de EMC AVAMAR realiza deduplicacion en origen confederada , es decir si "alguien" o "algo" ha copiado cierto patron de ficheros antes que tu , ya ni los copia.( si hay + de 500 usuarios y/o servidores ) sale muy a cuenta.

Para backup en destino Quantum dispone de las cabinas DXI5500 / 6500 y 75000 que realizan una deduplicacion una vez que el dato esta en su interior.

Mismo caso que lo anterior , sale "a cuenta" en caso de tener desde 30-40 TB a copiar.

Saludos!

Pedro dijo...

Yo creo que la deduplicación puede ser interesante en función del entorno.

Por ejemplo en un entorno de View con X Desktops virtuales, sí que creo que pueda aportar una mejora, tanto en ahorro de espacio, como en rendimiento. A mi forma de entender, si se distribuyen los escritorios por OS en diferentes LUNs, a estas se les puede aplicar deduplicación, dado que al compartir el mismo OS, los escritorios comparten una gran cantidad de bloques. A su vez, con estos bloques ya deduplicados, el acceso a ellos es muy alto, por lo que el sistema de almacenamiento los mantedrá en caché durante mas tiempo, pudiendo acceder a ellos de forma más rápida.

Saludos!!

Josep Ros dijo...

Gracias Javier,

Efectivamente comparto contigo lo de no usar la deduplicación para los entornos servidores y es ahí donde he querido poner el acento.

En las empresas españolas, la mayoría de entornos vSphere están entre 2 y 6 hosts con 1 ó 2 cabinas.

Luego, por supuesto, están las pocas empresas que constituyen lo que aquí llamamos las grandes empresas que manejan datos de más de 30TB, donde agradecemos que nos expliques qué sucede en vuestro caso particular.

Sin embargo creo que es la excepción que confirma la regla.

Saludos y gracias por participar en el blog

Josep Ros dijo...

Pedro muchas gracias por tu participación.

En entornos de View normalmente se utiliza linked clones, por lo que el grueso de lo común se conserva en la réplica inicial de la plantilla, por lo que la deduplicación no tiene demasiado sentido.

Pero aún en el caso de trabajar sin linked clones, lo que necesitamos precisamente en una cabina que soporte view es mucha potencia, porque el espacio no es ningún problema, de hecho se suelen implementar discos pequeños para conseguir muchas IOPS.

Sin embargo, agradezco que expongas tus experiencias y opiniones porque nos enriquece a todos.

Saludos!

Consulta Técnica

[Consulta Técnica][bleft]

Virtualización

[Virtualización][twocolumns]

Naturaleza

[Naturaleza][grids]