El concepto de Big Data está cobrando cada vez más importancia a nivel Empresarial y Comercial en Chile. Más Empresas están dispuestas a aprovechar al máximo todo el potencial que reside en sus datos, es por eso que AWS Chile y Morris & Opazo (Advanced Partner especialista en Big Data) organizaron durante la mañana del 9 de noviembre el Workshop “Construyendo un Data Lake en AWS”, que se llevó a cabo en las oficinas de Amazon Web Services en Chile, mostrando todo su reconocido conocimiento en la premiación de APN.
Desde AWS el Workshop estuvo a cargo de Jesús Federico ( https://www.linkedin.com/in/jesusf/ ), Arquitecto de Soluciones de AWS Chile, quien durante la primera parte del Workshop expuso de manera muy clara y concisa qué es AWS y los aspectos fundamentales de AWS Cloud; cuáles son sus principales servicios, las mejores prácticas de la arquitectura de la nube y los diferentes enfoques para implementar las arquitecturas de AWS, el modelo de responsabilidad compartida y las regiones y zonas de disponibilidad en AWS.
Esta primera parte fue crucial y permitió que los asistentes al evento (incluidos los directores de tecnología de empresas como Forum, SmartHomy, DIN SA, Maisasa, Entel, Grupo CGE, WOM, Facenote y abcdin) comenzaran a generar curiosidad sobre cómo AWS Cloud Computing, las características de Serverless y los diferentes servicios de AWS podrían beneficiar a varias áreas de sus empresas.
Durante el descanso, los asistentes pudieron hacer networking y al mismo tiempo resolver dudas y preguntas con los expositores del Taller.
Esta introducción también sirvió como antesala a la segunda parte del Workshop en el que Marcelo Rybertt, nuestro Country Manager, expuso en detalle qué es Big Data, qué es un Data Lake, cómo es su Data Flow, y cuáles son los servicios y herramientas que AWS nos proporciona los diferentes componentes del flujo de datos.
Para finalizar el Workshop, William Guzmán (Chief Operations Officer, Morris & Opazo) presentó en tiempo real 3 de los múltiples casos de uso en los que Big Data puede apoyar las operaciones de una Empresa. Estos incluyeron:
Análisis de Sentimiento en Tiempo Real en Redes Sociales:
Twitter brinda una excelente oportunidad para probar el concepto de transmisión de datos. Durante el Taller se solicitó a los asistentes que publicaran Tweets con ciertas palabras clave que luego serían reconocidas por una aplicación de Twitter.
Previamente en una instancia EC2 se ejecutaba una aplicación Nodejs, que ‘escuchaba’ los tweets generados y seleccionaba aquellos que coincidían con las palabras claves configuradas. Una vez que se detectaron los tweets, esta aplicación de Nodejs alimentó un flujo de datos en Amazon Kinesis que envió a un depósito S3 los tweets sin realizar ningún análisis hasta ese momento.
Una vez que se almacenó un objeto en el lago de datos, se ‘activó’ una función de AWS Lambda que, con el respaldo de Amazon Comprehend, identificó las entidades de cada tweet y realizó un análisis de sentimiento. Si el idioma original del tweet era diferente al inglés, la función Lambda usaba Amazon Translate para generar la traducción correspondiente a este idioma. El resultado de estos 3 análisis (entidades, opiniones y traducciones) se almacenó nuevamente en el lago de datos (en diferentes cubos).
Amazon Athena se encargó de realizar análisis a los datos no estructurados generados por la función Lambda, y puso esta información a disposición de cualquier consumidor. El elegido para el Workshop fue Amazon Quicksight, en el que los asistentes pudieron ver cómo aparecían en las diferentes secciones del dashboard tweets que ellos mismos habían creado durante la sesión:
- Tipos de entidades más citadas
- Sentimientos por minuto
- Texto original, traducción y opinión de cada tuit
- Geolocalización del tuit
Análisis de llamadas de Call Center con Machine Learning
A través de un tablero implementado en Kibana, las empresas que asistieron al Workshop vieron cómo se procesaban y analizaban diferentes archivos de audio para identificar en ellos las palabras clave, entidades, textos, datos y metadatos que contenía cada uno. Con este ejercicio evidenciaron una de las Best Practices for Cloud Architecture, dado que no existía un acoplamiento rígido entre cada componente del flujo de datos (para este caso se usó Kibana como consumidor del Data Lake, un sistema diferente al caso anterior pero con en S3 como lago de datos).
Reconocimiento de imágenes y videos usando Machine Learning
Los asistentes al evento pudieron ver cómo se entrenaba un sistema soportado por Amazon Rekognition subiendo una foto de una persona, y luego identificar en otro video o foto si se encontraba o no el rostro de la persona con la que se entrenaba el sistema.
No solo fue posible encontrar este tipo de coincidencias. Además de esto, Rekognition entregó información detallada sobre las etiquetas, funciones, características y celebridades que se encuentran en el video o la foto en tiempo real.
Texto: Morris & Opazo / WG height_on_tabs_portrait=”10″ height_on_mob_landscape=”10″ height_on_mob=” 10″][/vc_columna][/vc_fila]