© Josep Ros. Con la tecnología de Blogger.

La importancia del almacenamiento en un entorno virtualizado

Tras muchos años de diseñar, gestionar, administrar y soportar entornos virtualizados una de las conclusiones más importantes que he sacado es que el almacenamiento es vital.

Esto puede parecer de cajón pero para muchas empresas no lo es, ni le dan la importancia que realmente tiene y así les va luego, con problemas día sí y día también.

Sobre almacenamiento, como sobre cualquier otro tema cada uno tiene sus gustos y sus preferencias, muy respetables todas ellas.

Yo, en este post, voy a comentar aquellos aspectos que me parecen más relevantes del almacenamiento para un entorno virtualizado, por ejemplo con vSphere.

Los puntos que indico no están ordenados por prioridad. El orden es aleatorio tal cual me han venido a la mente en el momento de escribir este artículo.

1. Soporte técnico eficiente. Me gustaría que las cabinas que se implementan tuviesen un soporte técnico eficiente, que esté dado por expertos en almacenamiento que sepan lo que se traen entre manos. También me gustaría que el soporte pudiera ser de 2 horas tras producirse la incidencia. En entornos muy críticos 4 horas es excesivo.

2. Escalabilidad. Me gustaría que una cabina tenga la posibilidad de crecer, no sólo en número de discos, sino que ese crecimiento pueda hacerse también a nivel de memoria caché e incluso de controladoras, de modo que pueda pasar de un modelo a otro sin necesidad de tener que tirar una cabina y comprar otra.

3. Granularidad en el crecimiento. Las cabinas deben poder crecer de disco en disco, a voluntad del cliente, de modo que se puedan adquirir ahora 3 discos, más adelante 1 y después 20, en función de las necesidades empresariales que mueven el sistema TI.

4. Discos SAS y SATA. En todos los entornos tenemos máquinas virtuales más críticas y otras que o bien simplemente son réplicas o bien son máquinas con una menor demanda de I/O como pueda ser un servidor web, un servidor de archivos, etc. Sería perfecto poder tener diferentes tipologías de discos en la misma cabina para poder aprovechar esa dualidad de necesidades. Dicho sea de paso los discos de Fibra y FATA tienen los días contados. Casi todos los fabricantes han dicho que abandonan esa línea de negocio.

5. Capacidad de generar diferentes tipos de sistemas RAID. Algunas cabinas están limitadas a poder crear un sólo tipo de RAID, eso es una limitación muy importante, a mi entender, y me gustaría que una cabina pueda tener una superficie muy rápida como pueda ser un RAID 1+0 y otra más lenta como un RAID 5 ó RAID 6 para implementar VMs que no requieran de tanta velocidad.

6. Caché ampliable en todo lo posible. Uno de los elementos claves en el almacenamiento es la caché. Sería fantástico disponer de un sistema que no tenga una limitación de sólo 4GB u 8GB sino que se pueda continuar ampliando si las necesidades de negocio lo llegan a requerir.

7. Conectividad a gusto del cliente: iSCSI y FC. Para mí es ideal disponer de conexiones iSCSI y FC. Como sabeis recomiendo, siempre que sea posible, iSCSI, pero hay entornos en que sólo existe FC y, por una cuestión de dejar el entorno homogéneo, no está de más dejarlo con FC. Las controladoras, por tanto, deberían tener ambos tipos de conexionado disponible y que el cliente las utilice a voluntad.

8. Soporte preventivo. Un sistema de almacenamiento es tan crítico que todas las ayudas en la detección de problemas son pocas. Me gustaría que las cabinas tuviesen un mecanismo de autocontrol o soporte preventivo por el que el fabricante me indique si hay que cambiar alguna pieza de forma automatizada.

9. Réplica síncrona y asíncrona. En entornos de empresas medianas y grandes se requieren 2 cabinas con réplica más o menos síncrona. Me gustaría que esto no costase la torta de un pan y que se pudiese escoger entre una u otra.

10. Control de uso de la memoria caché. Este es un punto muy importante y da mucha vida al administrador del almacenamiento. Poder decidir cómo se asigna la caché, a qué LUN o VM y ver el uso real que la cabina hace de la memoria caché son elementos importantes a considerar.

11. Thin Provisioning. Me gustaría poder ampliar una LUN de forma fácil y que sea reconocible transparentemente por el entorno vSphere. La LUN que hoy nos parece suficiente con 300GB mañana se ha quedado pequeña y la tenemos que ampliar a 1TB, eso debería ser una operación fácil de realizar.

12. Demo de las máquinas. Cuando hay un cambio de cabinas los clientes tienen dudas de si los nuevos modelos seleccionados son los más adecuados. Que el fabricante 'se enrolle' y deje mediante un mecanismo simple (administrativo) las máquinas al cliente para que las pueda evaluar y quedárselas o devolverlas al fabricante sin mayor compromiso.

13. Control de uso de la memoria caché. Además de lo que ya comentado sobre la caché me gustaría también que se pudiesen definir tamaños de caché específicos para determinados servidores o VM, con el fin de adecuar el tamaño de la caché al del filesystem correspondiente.

Y ahora voy a indicar los elementos que no considero críticos:

1. Servicio de File Server o de NFS a nivel de cabina. No necesito ni uno ni otro para nada. Si quiero tener un File Server lo encapsulo en VMDK. Tenemos clientes con File Server virtualizados de 1,5TB y sin problemas, además con el Veeam las copias se hacen en pocos minutos mediante la réplica CBT. Por otra parte, si bien NFS funciona muy bien, con VMFS es más que suficiente para la inmensa mayoría de escenarios. Quiero que la cabina sea una SAN pura y que sirva una LUN iSCSI/FC y que se formatee directamente por vSphere y no tener ninguna otra capa por debajo. Tener cualquier servicio presentado por RDM significa no tenerlo realmente virtualizado y atenta contra la transportabilidad. Siempre que sea posible, prefiero VMDK a RDM.

2. Deduplicación. Siempre me ha parecido innecesario tener deduplicación en entornos de producción. La Deduplicación me parece fenomenal para entornos de archivo, por ejemplo, pero no la recomiendo en producción.

3. Snapshots. No solemos utilizar la funcionalidad de snapshots porque el vSphere ya lleva las suyas y preferimos no mezclarlas. Las snapshots de las cabinas pueden llegar a influir negativamente en el rendimiento y, por supuesto, no son un backup.

Y eso es todo... ya acaba agosto y empieza el nuevo curso escolar, a disfrutarlo!

Saludos,

14 comentarios:

Javier dijo...

En resumen, que te gusta NetApp

Josep Ros dijo...

Imagino que lo dices con ironía no?

:-)

klxout dijo...

Josep, y para tíe que marcas modelso sea ajustarían más a lo que comentas?
LA verdad es que ahroa lo estamo mirnado y es u ntema interesante y al a vez con multitud de opciones (cómo bien comentas)
Saludos

Victor M. Fernandez Gomez dijo...

Unicamente por puntualizar alguno de los puntos citados al margen del fabricante de la cabina de almacenamiento de proposito general (EMC, IBM, NetApp, Sun, Hitachi etc).

Me refiero a la relevancia de la distribución del uso de los diferentes discos de la mismas, tanto si son SSD, SAS, SATA o FC. En algunas se puede realizar esta asignación de forma manual, en otras recurriendo a productos de terceros y en las mas modernas se puede automatizar de forma dinamic este reparto.

Otro aspecto relevante con respecto a la utilizacion de las caches, es la posibilidad de diferenciar las de escritura de las de lectura; lo cual unido al parrafo anterior hace mas que viable implementar politicas de ILM en la gestión del almacenamiento que servirá de Datastore de las VMs.

Finalmente unido a todo esto el Thin Provisioning junto con la deduplicacion online (cuidado con esto por los consumos de las caches y la memoria) hace mas que necesaria una gestión proactiva del almacenamiento al margen si es implementado en base a SAN iSCSI o FC.

Salu2.

Javier dijo...

Con ironía o sin ella, cumple todo lo que propones, de hecho no se me ocurren muchas otras opciones

Asier Padilla dijo...

Pues creo que estoy totalmente de acuerdo con lo que dice señor, mas aún con lo que hemos vivido juntos sobre este tema.
Muy buen post.

Josep Ros dijo...

Gracias a todos por vuestra participación.

No pienso en un fabricante en concreto al escribir este post, sino en lo que al final creo importante y lo que prefiero que no exista (dedupliación).

@Kixout mándame un mail en privado y dime el tipo de cliente que tienes entre manos (número de usuarios y número de servidores que tiene) para que te indique un fabricante y modelo concreto, que no quiero que este post se convierta en publicidad de ningún fabricante.

Respecto a los comentarios de Javier, precisamente NetAPP hacen mucho hincapié en el tema de deduplicación y es lo que digo que prefiero no tener, más claro agua. NetAPP tiene una pérdida de rendimiento más que considerable cuando empiezan a llenarse las LUNS y eso tampoco me gusta demasiado, aunque, por supuesto, hay que decir que es un gran fabricante. Digamos que no es mi fabricante favorito de cabinas :-)

Un abrazo para todos!

Javier Martinez dijo...

Para mi existen dos fabricantes de cabinas que aconsejaria :

EMC , si no te importa la pasta.
HITACHI , si no puedes comprar EMC.

Alberto Verdu dijo...

Me parece estupenda la reflexión que haces nos ayudas a todos con estos aportes, y como siempre sigues fiel a tu dicho "somos agnositcos de hardware" pero creo que esta vez mientras escribias esto y hasta donde yo llego creo que estas pensando en Hitachi.

Un abrazo.

Josep Ros dijo...

Como siempre digo, depende del cliente final, número de usuarios... pero sí, Hitachi puede ser una buena opción, aunque lo he escrito pensando en las necesidades reales del cliente y no en publicitar a un proveedor determinado.

Saludos!

Álex Vivancos dijo...

Hola Josep

Me ha parecido muy interesante el artículo de almacenamiento.

Estoy un poco con Javier, es curioso cuando hablas de deduplicación, cambias el detalle técnico y hablas de sensaciones. ¿no prefieres la deduplicación en producción? ¿alguna razón?

Tienes razón en que NetApp aboga por la deduplicación, pero eso no es un aspecto negativo, te recuerdo que por defecto NetApp NO deduplica sus datos, por tanto, no es menos que la competencia según tu punto de vista.

Estoy de acuerdo contigo en que cualquier cliente requiere una solución a medida, quizá haya marcas que no encajen en el cliente por su rigidez, pero como dice Javier, quizá la única que cumple con todos los aspectos detallados es NetApp.

Funcionalidades tan importantes hoy en día en el mundo del almacenamiento como los snapshots y la deduplicación las nombras muy por encima. Hoy en día no hay fabricante de cabinas que las tenga o las esté desarrollando.

Por último en el tema de la conectividad, considero que te quedas algo corto con iSCSI y FC. Has probado NFS en entornos vSphere? Creo que no es nada despreciable los rendimientos que dan los NFS con respecto a la conectividad de bloques.

Gracias por tu artículo y por explicar lo difícil fácilmente.

Saludos

Álex Vivancos dijo...

Hola Josep

Me ha parecido muy interesante el artículo de almacenamiento.

Estoy un poco con Javier, es curioso cuando hablas de deduplicación, cambias el detalle técnico y hablas de sensaciones. ¿no prefieres la deduplicación en producción? ¿alguna razón?

Tienes razón en que NetApp aboga por la deduplicación, pero eso no es un aspecto negativo, te recuerdo que por defecto NetApp NO deduplica sus datos, por tanto, no es menos que la competencia según tu punto de vista.

Estoy de acuerdo contigo en que cualquier cliente requiere una solución a medida, quizá haya marcas que no encajen en el cliente por su rigidez, pero como dice Javier, quizá la única que cumple con todos los aspectos detallados es NetApp.

Funcionalidades tan importantes hoy en día en el mundo del almacenamiento como los snapshots y la deduplicación las nombras muy por encima. Hoy en día no hay fabricante de cabinas que las tenga o las esté desarrollando.

Por último en el tema de la conectividad, considero que te quedas algo corto con iSCSI y FC. Has probado NFS en entornos vSphere? Creo que no es nada despreciable los rendimientos que dan los NFS con respecto a la conectividad de bloques.

Gracias por tu artículo y por explicar lo difícil fácilmente.

Saludos

pepeasecas dijo...

Sí señor, Josep

Me lo guardo, lo imprimo y lo plastifico

Josep Ros dijo...

Hola Álex y gracias por los comentarios del artículo. Me alegro que te haya gustado, aunque podamos discrepar en determinadas consideraciones, claro.

No recomiendo en producción la deduplicación por una cuestión de rendimiento, en primera instancia y por problemas que puedan surgir con la propia deduplicación (algún cliente la ha liado parda) en segundo término.

Respecto a lo que comentas de que sólo NetAPP cumple con lo que comento, no estoy de acuerdo en absoluto, de hecho coincido más con lo que dice Javier Martínez respecto a marcas como Hitachi o EMC.

Las snapshots y la deduplicación, para mí, no son en tan importantes a nivel de cabina, al igual que NFS. En vSphere ya tengo snapshots, la deduplicación en producción: no gracias y tengo VMFS, por lo que tampoco es preciso NFS.

Entiendo que NetAPP sí que hace mucha fuerza comercial con todo el tema del NFS, la Deduplicación, servir directamente NTFS (no es necesario) y conectar directamente la unidad de cintas a la cabina (tampoco lo quiero).

Al final, claro, son todo gustos y preferencias dadas por la experiencia de cada uno.

No pretendo ni sentar cátedra ni decir que lo que aquí digo sea la única opción, pero sí es la mía :-)

Saludos cordiales!

Consulta Técnica

[Consulta Técnica][bleft]

Virtualización

[Virtualización][twocolumns]

Naturaleza

[Naturaleza][grids]