Necesitas Iniciar Sesión

Analítica avanzada y predictiva con Data Lake Virtual

Aug 21, 2019 94

Publicamos grabación de webinar del pasado julio de 2019 en español de Anastasio Molano, de Denodo.

Anastasio explica en el webinar cómo las arquitecturas tradicionales de análisis de datos con tecnologías relacionales han quedado obsoletas.

El volúmen, la disparidad de fuentes, la necesidad de análisis en tiempo real, repositorios como Hadoop o Cassandra, los datos provenientes de sensores o redes sociales (desestructurados) hacen que los Data Warehouse tradicionales no sean ya una solución factible en grandes proyectos de Datos. 

Ahora se plantean los Data Lakes Virtuales que permiten el acceso ágil a grandes volúmenes de datos. 

En el webinar Anastasio explica cómo funcionan los Logical Data Lakes, cuál es su arquitectura y sus posibilidades. 

En el vídeo realiza un ejemplo práctico de un proyecto de Analítica Predictiva a partir de los datos de una empresa de Nueva York que alquila bicicletas.

Se trata de poner en marcha un modelo predictivo que prevea el uso futuro del servicio a partir de los datos pasados. Además añade datos de elementos externos como el tiempo. 

Tras la demo Molano explica una serie de casos de clientes que están utilizando la tecnología de Denodo como pieza fundamental de sus arquitecturas de analítica avanzada de datos. 

Los capítulos del video son:

Arquitecturas Lógicas de Provisión de Datos: hacia un Lago de Datos Virtual 03:40

¿Qué es la Virtualización de datos? 9:00

Lagos de Datos Virtuales 14:20

Arquitectura de Referencia de un Data Lake Virtual 14:45

Flujo de Trabajo típico de un Científico de Datos 17:45

Mejores prácticas: Modelo Colaborativo IT- Científico de Datos 20:00

Descubrimiento y exploración de datos en el Lago 23:36

Transformación y combinación de datos 24:12

Transformación y combinación de datos 24:12

Materialización de datos en el lago (Opcional) 25:03

Análisis mediante herramientas científicas (ML, etc...) 25:36

Operacionalización de los Modelos 26:30

Publicación de los resultados a los usuarios de negocio 27:30

Gobierno y Seguridad centralizada del lago de datos 27:52

¿Cómo ayuda la Virtualización de datos en cada fase? 28:55

Un caso práctico de analítica predictiva 29:13

Ejemplo de cliente: Autodesk 44:20

El caso de Progolics 46:30

Un par de apuntes sobre rendimiento del lago de datos virtual 47:30

Ventajas de utilizar un Lago de Datos Virtual 48:40

Preguntas y Respuestas 51:10

Se pueden utilizar cualquier librería de Machine Learning 51:30

Integración de cualquier tipo de repositorio 52:13

Donde se ejecutan los los modelos ML 52:50

Integración con Python (Zepelin) 53:50

 

 

También Puede Interesarte ...