Enzo Longobuco: “Algo que realizas de un modo friki dentro de tu casa puede convertirse en una aplicación para el mundo real”

21 febrero, 2023
Enzo Longobuco Miralles, alumno del grado de Ciencia de Datos Aplicada de la UOC. Enzo Longobuco Miralles, alumno del grado de Ciencia de Datos Aplicada de la UOC.

Enzo Longobuco Miralles es alumno del grado de Ciencia de Datos Aplicada de la UOC y ha sido uno de los finalistas del AB Data Challenge, una iniciativa impulsada por Aigües de Barcelona que, en colaboración con universidades y centros de investigación de Cataluña, pretende potenciar los datos recopilados y convertirlos en fuente de innovación interdisciplinaria. 

El proyecto que le ha llevado hasta la final del certamen está basado en un generador de modelos mediante el uso del ensemble learning.  No es la única iniciativa que ha liderado este alumno: con tan solo 19 años emprendió y llegó a arrancar una startup basada en el IoT (Internet of Things). El manejo de datos ha permitido que su proyecto mejore la experiencia del cliente, un objetivo que esperan mejorar aún más con el uso de la inteligencia artificial. 

¿En qué consiste el modelo que te ha llevado a ser finalista del AB Data Challenge?

El proyecto se basa en un programa capaz de generar modelos. Se introducen los datos, se escogen aquellos que se consideran más relevantes y eso genera uno o varios modelos, en función del tipo de modelo para la solución. Según la métrica que se quiera priorizar, se selecciona un modelo de aplicación u otro.

¿Cómo definirías el ensemble learning y cómo se puede aplicar para llevar a cabo predicciones?

Es el trabajo en equipo de los modelos. Es decir, se selecciona un modelo, se entrenan varias versiones y se escoge la mejor. A partir de este modelo, se utiliza el resultado para entrenar el siguiente modelo con otras versiones desde cero, como si fuera la versión inicial. Es como una especie de cadena que acaba generando un último modelo que debe ser el mejor de todos. Tienes que ir con cuidado para que no sea demasiado perfecto, porque limitaría su generalización y haría imposible su uso en otros campos. 

 ¿Cuál es la aplicación concreta de tu proyecto?

Puse como ejemplo la predicción del consumo de agua agrupado por zonas y por fecha, basándome en el registro de varios lugares y de la relación entre los datos de la zona que queremos predecir y las otras. No aportaba los datos de consumo de forma aleatoria, sino que ponía un número que relacionaba la zona que me interesaba con las demás. Esto hacía que el dataset fuera más grande y, por lo tanto, más preciso. Es decir: contextualizaba el dato con otros resultados reales ya contrastados. 

El proyecto se basa en un programa capaz de generar modelos: se introducen los datos, se escogen aquellos que se consideran más relevantes y eso genera uno o varios modelos, en función del tipo de modelo para la solución.

¿Qué te ha llevado a ejecutarlo por esta vía?

Inicialmente, probé de buscar correlaciones con datos de terceros, datos públicos, pero me di cuenta de que la diferencia era enorme. No había correlación ni causa-efecto, como esperaba. Los datos públicos, comparados con los que se registraban en los sensores de la ciudad, eran muy variables. En este contexto, me centré solo en el sistema de Aigües de Barcelona, que es bastante particular, para hacer una predicción de cómo se iba a comportar el sistema. 

Si utilizaba datos públicos no cambiaba nada: no existía relación en los resultados. Por ejemplo, a nivel estacional, en verano no se mostraba un mayor consumo de agua. Hay información que maneja Aigües de Barcelona que no conozco, pero que creaba una correlación entre ellas: cuando empecé a utilizar esos datos, entonces sí que había relaciones precisas entre zonas.

¿Se puede alcanzar una eficiencia energética con la aplicación de proyectos como el tuyo? ¿Cómo puede controlar el consumidor estos modelos?

Absolutamente. Cualquier proyecto que ayude a la toma de decisiones basándose en datos permite optimizar procesos de forma mucho más eficiente. Esto implica una reducción en el gasto de energía, lo que puede ser beneficioso para el medio ambiente.

El consumidor puede controlarlo partiendo de los datos. Los modelos se alimentan de los datos que se registran en los sensores. Si yo soy un consumidor de Aigües de Barcelona, debo hacer un consumo responsable en base a los resultados del modelo. Por ejemplo, puedes observar si te has pasado de consumo sin ningún motivo que lo justifique. Es una simbiosis entre el día a día y los resultados que ofrecen estos modelos. Y así, poco a poco, van mejorando los siguientes modelos con los propios datos que se van generando.

Enzo Longobuco durante la presentación de su proyecto en el marco del AB Data Challenge de Aigües de Barcelona.

¿Que ha supuesto ser finalista del AB Data Challenge?

Ha sido toda una sorpresa. Era el único que se presentaba de forma individual, ya que detrás del resto de proyectos había grupos. Además, estaba en plena época de preexámenes, así que no confiaba mucho en el resultado. En mi empresa (CD4IOT), también, ha tenido muchísimo impacto, y me ha funcionado para hacer negocio. 

A nivel académico me ha permitido darme cuenta de que, aunque haya llegado tan lejos en la iniciativa de Aigües de Barcelona, me ha costado mucho estudiar cálculo. He sido testigo de cómo algo que realizas de un modo friki, porque te apasiona, dentro de tu casa puede convertirse en una aplicación para el mundo real.

 ¿Has seguido adelante con este proyecto por otra vía?

Sí, internamente lo seguimos trabajando y lo vamos a desarrollar para otras soluciones. En mi empresa, durante el covid, hicimos un proyecto de Inteligencia Artificial para predecir la calidad del aire. Con el resultado realizamos predicciones que permitían determinar si la gente mayor se tenía que mover o no de sala con el objetivo de acometer ciertas labores como ventilar o desinfectar el lugar. Todo esto lo hicimos con un modelo distinto, pero sí que podemos aplicarlo a proyectos como el de la proyección del aire. Nos va a servir mucho para otras soluciones que no tienen nada que ver. Al final lo que interesa es cómo se genera el modelo.

Ser finalista del AB Data Challenge ha sido toda una sorpresa. He sido testigo de cómo algo que realizas de un modo friki, porque te apasiona, dentro de tu casa puede convertirse en una aplicación para el mundo real.

¿Qué retos y obstáculos has encontrado en este proceso?

El hacerlo solo ha sido un reto muy grande. He tenido que trabajarlo todo con tiempo, dedicando más horas de las que me permitían los días. Ha sido una entrega absoluta. Otro reto ha sido la información que me aportaban los datos en sí mismos. Cuando observé que no había relación entre los datos de Aigües y los públicos, hubo un momento de pánico. Uno de los aspectos más complicados ha sido explicarlo. Es algo muy enrevesado y complejo para alguien que nunca ha escuchado hablar sobre ello.

¿Han sido los Estudios de Informática, Multimedia y Telecomunicación, más concretamente el grado de Ciencia de Datos Aplicada, esenciales para desarrollar este proyecto?

Absolutamente, sobre todo los estudios en programación. El haberme dedicado a la programación me ha ayudado mucho. Y también lo ha hecho mi experiencia con la empresa. Llevo cuatro años realizando análisis de datos en el trabajo y esto ha impulsado el proyecto. Además, el grado de Ciencia de Datos Aplicada de la UOC me ha ayudado a aplicar toda la teoría como se debe. Hasta ahora había visto cómo se podían hacer las cosas, pero la UOC te ayuda a cerrar el circuito de práctica y teoría.

Además de esa formación práctica y teórica, ¿cómo dirías que ha sido tu experiencia formativa con el grado de Ciencia de Datos Aplicada?

La formación de la UOC me ha aportado mucha claridad acerca de las técnicas de análisis de datos.  He afianzado conceptos que tenía en una especie de laguna y también me ha permitido adquirir unos niveles de organización que no tenía hasta entonces. Ahora estudio de forma mucho más disciplinada y organizada.

(Visited 187 times, 1 visits today)
Autor / Autora
Periodista
Comentarios
Deja un comentario