© Josep Ros. Con la tecnología de Blogger.

Introducción al Big Data con Pentaho

En este mundo tan cambiante de las tecnologías de la informacion llevamos meses escuchando conceptos como Internet de las Cosas (Internet of things - IoT) o Big Data, con su propia nomenclatura tan característica que incluye términos tales como Científico de Datos o Lago de Datos.

Y es que nuestro mundo es muy cambiante y hay que adaptarse rápidamente o morir. Así aquellos que se han quedado anclados en la virtualiación deberían saber que hablar de virtualización como novedad es como hablar de sistema operativo como novedad, un sinsentido. Hay que mirar más allá de la infraestructura y dirigir nuestros esfuerzos cada vez más al negocio.

Porque una vez que tenemos bien asentada la infraestructura, con un hardware adecuadamente sobredimensionado a las necesidades empresariales y debidamente protegido tanto internamente en el CPD de producción como a nivel de Disaster Recovery con un CPD de contingencia testado y verificado, estamos en condiciones de centrarnos en la inteligencia de negocio.

Conviene pues hablar con el equipo de dirección, crear un gabinete mixto de personas de negocio y personas de mundo TIC y abordar conjuntamente los retos que nuestra organizacion precisa para mejorar su competitividad.

Y aquí nos encontramos con el Big Data que se integra por tres componentes difíciles de conciliar:

1. Personas de dirección de negocio. Muchas veces las personas propietarias del negocio o aquellos que tienen la responsabilidad última en la toma de decisiones, viven  un poco de espaldas al mundo tecnológico. Aquí hay que decir que hemos realizado un gran esfuerzo desde el mundo TIC en crearnos una fama de frikis muy encerrados en nuestro mundo y poco abiertos a escuchar otros temas. Habría que pedir a estos responsables de negocio que tengan paciencia con los otros dos grupos y les sepan escuchar y pidan aquellas explicaciones de nomenclaturas 'extrañas' para que todos se puedan entender adecuadamente.

2. Personas de infraestructuras. Son aquellos responsables del departamento TIC que tienen que poner la base hardware para que los datos puedan fluir en tiempo real. Las nuevas cabinas con multitiering en tiempo real y la adopción de discos SSD y discos Flash de altísimas capacidades de rendimiento nos permiten que todo el negocio de la empresa pueda fluír y ser analizado en tiempo real, sin largas esperas de informes críticos. Este equipo de personas deben empezar a hablar lenguaje empresarial y orientar más su discurso a hablar de servicios a prestar y menos a utilizar tecnicismos que le separan del primer grupo de personas.

3. Científicos de datos. Esta profesión, con escasos meses de vida tiene un largo futuro y es una evolución de aquellas personas que siempre han trabajado alrededor del análisis de datos. Los científicos de datos van a traducir los datos de a empresa a valores inteligibles por la dirección, yendo un paso más allá que el de dar mensajes triviales tales como qué hemos vendido cada trimestre, para pasar a interactuar con todo tipo de fuentes de información como redes sociales, patrones de tiempo, Internet de las cosas y muchas otras que harán que podamos tomar decisiones a nivel empresarial para optimizar el producto que vendemos a nuestros clientes.

Sorprende que una empresa como Hitachi Data Systems, muy centrada en infraestructura y, particularmente, en almacenamiento, haya dado el paso de adquirir varias empresas relacionadas con el Big Data, la salud y el IoT. Concretamente se ha hecho ya oficial la adquisición de Pentaho, que es un software de libre distribución muy conocido en el mundo del Big Data. Con este paso HDS se posiciona dando importancia a un tipo de tecnología que está en plena efervescencia, al igual que están haciendo el resto de compañías tecnológicas.

Podemos ver en la Wikipedia que Pentaho se define a si mismo como una plataforma de BI “orientada a la solución” y “centrada en procesos” que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos.


Pentaho se compone de un servidor OLAP (Pentaho Analysis Services, un motor de presentación (Pentaho Reporting) un módulo de análisis predictivo (Pentaho Data Mining), una plataforma de presentación de datos (Pentaho Dashboard) y un conector para el acceso al lago de datos manejado por Hadoop (Pentaho para Apache Hadoop).

HDS está diseñando una plataforma hardware que integrará la potencia de sus sistemas SAN con la suite de Pentaho, creando así un producto integrado que se pueda implementar en el cliente y empezar a realizar tareas de Big Data de forma óptima desde el minuto 0.

Desde Ncora vamos a seguir muy de cerca todas las tecnologías de Big Data porque pensamos que forman parte inerente de los sistemas de información y es una pieza clave para la competitividad de negocio.

Feliz verano! Nos volvemos a ver a principios del curso escolar! :-)

1 comentario:

vasudha dharani dijo...

Qlik View Corporate Training | Online Training by real time Experts with IT Support IND: 910-0934572. Online Training classes gives you complete knowledge by 21st Century. send ur enquiry to contact@21cssindia.com. or Call +917386622889 http://www.21cssindia.com/qlik-view-training Qlik View Training| USA:201-210-8616|Online/Corporate training|21cssindia 

Consulta Técnica

[Consulta Técnica][bleft]

Virtualización

[Virtualización][twocolumns]

Naturaleza

[Naturaleza][grids]