Germán Telmo Eizaguirre: “Investigamos métodos para que los programadores y analistas de datos puedan utilizar recursos remotos de manera eficiente”

18 enero, 2022
Germán Telmo

Germán Telmo Eizaguirre vive y estudia en Tarragona desde hace seis años, aunque es de Guipúzcoa. Es un apasionado de su familia y de sus amigos, que asegura son los que le han ayudado a llegar donde está hoy en día. Para despejarse y desconectar de la rutina, el beatbox y el deporte son sus aliados. Precisamente son estos los que le han acompañado durante este último año mientras cursaba el Máster universitario de Ingeniería Computacional y Matemática ofrecido por la Universitat Oberta de Catalunya (UOC) y la Universitat Rovira i Virgili (URV).

Hablamos con Germán sobre su trayectoría, su interesante Trabajo de Fin de Máster (TFM) y conocemos su experiencia como alumno del máster interuniversitario de la UOC y la URV:

¿Qué formación académica has realizado antes de entrar en el máster de Ingeniería Computacional y Matemática?

Vine a Tarragona en 2015 a estudiar el doble grado en Biotecnología e Ingeniería Informática en la Universidad Rovira i Virgili. Durante la carrera, realicé prácticas en laboratorios de bioinformática y análisis genómico en Azti (Pasaia) y en el IIS Biodonostia (Donostia-San Sebastián). También he colaborado activamente en un proyecto de este último centro, en el laboratorio de Biología Computacional. Durante el último año de carrera (2019-2020), comencé como becario de investigación en el grupo Cloudlab de la Universidad Rovira i Virgili, colaborando con el proyecto europeo CloudButton, donde aún sigo. En el grupo centramos nuestra actividad en los sistemas distribuidos, y más concretamente, en la computación en la nube.

En 2020 acabé los estudios de grado, y me dieron la posibilidad de realizar el doctorado en el propio grupo Cloudlab, tras acabar los estudios de máster. Decidí estudiar un máster no presencial para poder compatibilizarlo con mi contrato de becario de investigación, y la UOC me pareció una opción interesante. Opté por el Máster de Ingeniería Computacional y Matemática porque me ofrecía una formación muy complementaria a lo que sería mi tesis.

¿Cuáles fueron las inquietudes que te llevaron a la temática de tu TFM?

Durante mi estancia como becario de investigación en el grupo Cloudlab, desde antes de los estudios de máster, estudié los sistemas de análisis de datos en la nube. Básicamente, investigamos métodos para que los programadores y analistas de datos puedan utilizar recursos remotos de manera eficiente. Estos recursos remotos son ordenadores y servicios de computación “virtuales”, alojados en centros de datos enormes y que son accedidos por la red. Los gestiona un proveedor de recursos en la nube, que puede ser Amazon Web Services, Microsoft Azure, o por ejemplo, en el caso de nuestra investigación, IBM Cloud.

¿Puedes ponernos un ejemplo?

Imaginemos que un analista tiene un portátil de gama baja, con una capacidad de memoria y computación mínimas. Sin embargo, debe aplicar un algoritmo muy exigente a un conjunto de datos de 100GB. Obviamente, su ordenador no será capaz de realizar esta operación. ¿Qué alternativas le ofrece la computación en la nube? Guardar el conjunto de datos en un sistema de almacenamiento remoto, y “alquilar” recursos más potentes del proveedor que se encarguen de realizar las operaciones necesarias.

Concretamente, seguimos el paradigma serverless, que pretende simplificar al máximo este aprovisionamiento de recursos por parte del usuario. Como objetivo final, querríamos que el usuario simplemente indicara los datos a analizar y la operación a aplicar sobre ellos, y el sistema le asignara de manera inteligente el tipo y el volumen de recursos óptimo para la tarea.

¿Cómo surgió la idea del proyecto?

Dentro de nuestra línea de investigación, el EMBL (Laboratorio Europeo de Biología Molecular), con quien colaboramos en el proyecto CloudButton, se encontró con el problema de ordenar grandes volúmenes de datos mediante cloud functions. Las cloud functions son unidades de computación básicas que puede contratar un cliente de un proveedor de la nube. Tienen memoria y tiempo de ejecución máximo limitados, pero se pueden invocar muy rápido y más de 1000 a la vez. Lo más importante es que no requieren prácticamente ninguna gestión ni protocolo de aprovisionamiento complejo por parte del usuario. El programador simplemente indica qué quiere ejecutar en la cloud function y el proveedor lo encapsula y lo ejecuta automáticamente con sus recursos.

La ordenación mediante cloud functions se puede realizar muy rápidamente, porque puedes dividir el trabajo en muchas unidades operativas. Sin embargo, requiere mucha comunicación (tanto en volumen de datos comunicados como en número de comunicaciones) entre dichas unidades, lo que puede lastrar bastante la operación.

Mi director de tesis y yo afrontamos este problema parcialmente y publicamos nuestras contribuciones en el congreso internacional Middleware, con el paper Primula: a Practical Shuffle/Sort Operator for Serverless Computing. Propusimos un sistema que optimiza la ordenación e incluye un método analítico para predecir el número óptimo de cloud functions en base al tamaño de los datos. Decidimos que profundizar aún más en este trabajo era una buena opción para la tesis.

¿Qué objetivos generales te planteaste?

Para la tesis del máster, decidimos continuar con este trabajo refinando nuestras contribuciones, generalizando nuestros resultados a operaciones más allá de la ordenación y buscando estrategias para optimizar la comunicación. Nuestros objetivos principales fueron dos. Primero, mejorar el rendimiento de nuestro sistema de ordenación en la nube con conjuntos de datos de gran escala. Segundo, generalizar nuestro sistema de predicción a otras operaciones más allá de la ordenación.

¿Cómo has vivido el desarrollo de tu Trabajo de Fin de Máster?

En mi caso, como ya llevaba experiencia previa en el grupo con el que realicé el TFM y con mi director de tesis, fue un desarrollo bastante cómodo. Si bien es cierto que coordinar su desarrollo con las asignaturas del máster a veces es algo agobiante, una vez tuve el estudio y los resultados acabados, escribir el documento fue relativamente fácil. También debo decir que, aunque el desarrollo fue bastante exclusivo entre mi director y yo, desde la UOC fueron resolviendo todas las dudas sobre documentación que tuve y la comunicación con los matriculados en el TFM fue buena. Todas las fechas, plazos y formatos estuvieron claros desde el principio y las pautas estaban bien definidas.

En él, agradeces a tu director de tesi (Dr. Sánchez Artigas) su soporte durante este camino. Explícanos cómo ha sido trabajar con él.

Con mi director tengo una relación muy cercana y la verdad es que sin su ayuda me hubiera sido literalmente imposible desarrollar las contribuciones hasta este punto. Siempre ofrece un punto de vista incisivo sobre los problemas, sabe afrontar los contratiempos y ofrece ayuda en todo lo que necesitas. Además, me ofreció libertad, tanto en horarios como en muchas decisiones, en el desarrollo del proyecto, pero mantuvo siempre la supervisión con reuniones periódicas. En general, ha sido un gustazo trabajar con él.

¿Qué expectativas tenías del máster?

El máster fue exactamente lo que esperaba: una visión más especializada que la de la carrera en dominios como las matemáticas. He tenido asignaturas que me han resultado enormemente interesantes, haciendo que me interese incluso por temas con los que no me sentía nada atraído antes. Como mención, me ha encantado la asignatura de redes complejas: conceptos que leo día a día en publicaciones y algoritmos y metodologías aplicables a un montón de áreas de nuestro entorno. 

Has pasado de estudiar presencialmente a un entorno totalmente digital. ¿Qué tal la relación online con los profesores?

Los profesores son en general muy dedicados y cercanos con los alumnos, a pesar de ser totalmente a distancia. La metodología es completamente no presencial (todo mediante PDF, algunas clases grabadas, vídeos externos…), y no hay ninguna asignatura con exigencias de horarios, más allá de un par exámenes en total por cuatrimestre (la mayoría de asignaturas no tienen exámenes y son evaluadas íntegramente por entregas de prácticas a lo largo del curso). La dinámica se puede hacer algo incómoda para los que estamos acostumbrados a las clases presenciales, y uno tarda en aprender a gestionar su tiempo en este modelo. Sin embargo, es perfecto para coordinarlo, como es mi caso, con un trabajo a media jornada.

¿Se han cumplido tus expectativas?

Sí, tanto en materia de contenido como de metodología y horarios. No he tenido ningún imprevisto, el volumen de trabajo ha sido el esperado. Hay fases del curso en las que vas bastante justo y no es un máster que puedas aprobar sin dedicarle tiempo, porque el nivel de exigencia y de profundidad de los conceptos es alto. Sin embargo, es exactamente lo que esperaba, un posgrado que realmente me aporte conocimiento y práctica en temas más concretos.

¿Qué destacarías del programa del máster universitario de Ingeniería Computacional y Matemática de la UOC?

Lo más destacable es  el contenido del máster: está actualizado, es exigente y útil y profundiza bastante en los diferentes temas que tratas. En la mayoría de asignaturas la comunicación entre profesor y alumno es muy buena. La UOC asigna un foro a cada asignatura que se llena de mensajes enseguida, con los profesores respondiendo a las dudas de los alumnos e incluso los alumnos colaborando para resolver sus propias dudas. Los profesores ponen empeño en ofrecer una educación de calidad, escuchan y responden a las peticiones de los alumnos: si el calendario de entregas es demasiado ajustado, si algún recurso no funciona o si algún concepto es demasiado complicado.

¿Qué te motivó a completar tu formación académica con un máster como el que has cursado recientemente?

Cursé el máster principalmente por razones prácticas, ya que piden tener estudios de máster para acceder a las becas de doctorado.

¿Qué consejo darías a los alumnos que se están planteando empezar el máster de Ingeniería Computacional y Matemática?

Aconsejaría aproximarse al mundo laboral o al académico, según lo que se quiera hacer después, de manera paralela a los estudios de máster. Un máster a distancia es muy compatible con actividades externas, e incluso puedes adaptar el número de créditos para darte más espacio – nadie te obliga a aprobarlo en el tiempo mínimo. Así vas generando contactos y viendo lo que te gusta mientras estudias y acabas los estudios de posgrado con una ventana más abierta de posibilidades. También les recomendaría que se asignen horarios desde el principio, la no presencialidad puede ser bastante engañosa a la hora de distribuir las tareas y las primeras semanas es fácil que te veas algo saturado.

¿Qué te ha aportado a nivel laboral?

Este máster de Ingeniería Computacional y Matemática me ha aportado una formación, en mi caso, que me es muy útil en el día a día, a la hora de estudiar las publicaciones de otros autores, entender conceptos o diseñar experimentos para nuestra propia investigación.

¿Cuáles son tus planes de futuro?

Mi plan de futuro ideal a largo plazo sería trabajar como profesor titular universitario, porque es una idea que me atrae desde hace bastante tiempo. A medio plazo, tengo suficiente con centrarme en la tesis doctoral y esperar la resolución de las becas de la Generalitat de Catalunya.

(Visited 15 times, 1 visits today)
Autor / Autora
Redactora de contenidos.
Comentarios
Deja un comentario