Educación situada, el proyecto que permite reducir la huella de carbono gracias a los datos abiertos

23 mayo, 2023
Entrevista a César García sobre el valor de los datos abiertos Cesar García, estudiante del máster universitario de Ciencia de Datos de la UOC.

César García Sáez es estudiante del máster universitario de Ciencia de Datos de la UOC, formación con la que ha completado sus estudios en Ingeniería Técnica de Sistemas. Su proyecto «Educación situada – Cómo reducir la huella de carbono con datos abiertos universitarios» ha obtenido el primer premio en el Datathon UniversiDATA, certamen organizado por el portal de datos abiertos sobre educación superior. Durante más de dos décadas ha trabajado en temas relacionados con nuevas tecnologías e informática y durante 13 años ha desarrollado su labor en el Ayuntamiento de Madrid, trabajando en el área de sistemas. Su trayectoria también le ha llevado a trabajar con impresión 3D y herramientas libres. Los últimos años de su carrera profesional los ha pasado como investigador independiente y formador en nuevas tecnologías, especialmente en el área de fabricación digital y el Internet de las cosas (IoT). 

¿Cómo pueden ayudar los datos al estudiantado que se traslada a las universidades?

UniversiDATA es una iniciativa que surge de varias universidades para empezar a compartir sus datos como datos abiertos de forma unificada y estandarizar los datos de los distintos centros. Desde este portal proponen a la gente presentar proyectos que utilicen esos datos. Cada año se desplazan muchos estudiantes a Madrid y tienen que escoger dónde residir. Una forma de buscar vivienda es en los portales web que todos conocemos, pero muchas veces no tienes información para decidir el lugar concreto. Con el proyecto Educación situada se muestra el trayecto desde las distintas ubicaciones que se escojan: distancia, coste, huella de carbono… El objetivo es que tengan más información para la toma de decisiones.

¿Cómo funciona la aplicación que has desarrollado? 

Esta aplicación utiliza una herramienta que se llama mapas isócronos, que permite visualizar todos los puntos del mapa que están a la misma distancia de un punto concreto. De este modo, puedes saber qué es lo que hay a 15 minutos, 20 minutos, 30 minutos… Si vives alrededor de una parada de metro o de tren puedes escoger una vivienda más lejana al centro. Quizás solo son 10 minutos al día, pero a lo largo del año son bastantes euros y muchas horas. 

¿En qué datos te has basado para lograr este funcionamiento?

La aplicación tiene como punto de partida los datos de UniversiDATA. El primer paso ha sido localizar los datos que necesitaba dentro de los distintos conjuntos de datos. Estos están estandarizados por temáticas: estudiantes organizados por titulación, centros de estudios organizados por estudios académicos, etc. Primero hay que organizar los datos y mezclarlos para conseguir los datos imprescindibles para el proyecto, entre los que se incluye la ubicación de cada uno de los centros donde se han impartido cada una de las titulaciones. Después, lo que se ha hecho es trabajar sobre estas ubicaciones para la creación de un mapa, llamando a un servicio externo que creará los mapas isócronos. Este tipo de mapas requieren un proceso complejo de cálculo, pero afortunadamente hay servicios web que te dan los mapas de forma ágil.

¿Qué información nos facilita esta aplicación?

La aplicación te permite comparar las distintas opciones de transporte para llegar desde las viviendas que estás evaluando hasta tu centro de estudios. Para ello se muestran al usuario varias pantallas: la primera te pregunta por el centro de estudios, después te pregunta los dos lugares a comparar (que serían los pisos o ubicaciones potenciales). A partir de estos datos, calcula las rutas en transporte público, bicicleta y a motor. Al usuario se le muestra un resumen de cada ruta, informándole sobre el tiempo, el gasto económico y la huella de carbono.

El proyecto Educación situada permite comparar las distintas opciones de transporte para llegar desde las viviendas que se están evaluando hasta un centro de estudios, teniendo en cuenta el tiempo, el gasto económico y la huella de carbono de cada ruta.

¿Por qué decides diseñar una aplicación con este objetivo?

Uno de los principales objetivos era facilitar la vida a los estudiantes. Muchas veces los trámites previos a la matrícula e inscripción se centran en lo académico, dejando fuera otros aspectos que pueden ser muy importantes cuando se inician unos nuevos estudios en otra ciudad. Esta iniciativa puede ser útil para acompañar en la toma de decisiones a estos estudiantes y facilitar así su proceso de matriculación.

¿Qué ha supuesto el reconocimiento en Datathon UniversiDATA?

Para mí es una gran alegría. Yo estoy dando clase de datos abiertos y cuando  imparto esta formación trato de que los alumnos encuentren soluciones a través de los datos disponibles. La gente se sorprende de la existencia de estos conjuntos de datos. Todo reconocimiento que ayude a visibilizar la existencia y utilidad de estos conjuntos de datos, me resulta muy positivo. Descubrir que en un concurso así la ayuda  al estudiante tiene buena acogida ha sido muy gratificante. Como estudiante del máster universitario de Ciencia de Datos ha sido un orgullo ver que se reconozcan estos estudios dentro de un concurso abierto. El reto de programar en muy poco tiempo y muy rápido algo así también ha sido un aliciente inmenso. 

¿Qué te llevó a presentar tu proyecto a este concurso?

Me enteré de este concurso a través del portal datos.es, que trata sobre datos abiertos y agrupa todas las webs que trabajan con esta información en España. La web dispone de una sección del blog donde recogen iniciativas y proyectos novedosos. Me pareció un caso de uso interesante, el hecho de poder acceder a datos de varias universidades de forma unificada. El año anterior UniversiDATA ganó la iniciativa de mejor proyecto de datos abiertos de España. El hecho de verme frente al reto y lanzarme a por ello, me gustó. Si miramos concursos relacionados con los datos hay muchísimos, pero este, que es de datos universitarios y datos reales, me pareció muy interesante. Aquí los datos estaban bien documentados y estructurados para hacer algo decente. 

Partes de datos abiertos de universidades, ¿son lo bastante transparentes, en este sentido, las universidades de nuestro país? 

En UniversiDATA se comparten bastantes datos. Eso es muy útil, pero me gustaría que hubiera más universidades que se sumaran a esta iniciativa. Cuantos más centros estén dispuestos a exponer sus datos de forma común, mejor. Con los datos abiertos, siempre llegas a alguna puerta cerrada. En mi caso, por ejemplo, me di cuenta de que aunque estuvieran estandarizados los campos, los contenidos no lo estaban, por lo que no puedes encontrar los mismos estudios en varias universidades bajo un mismo nombre. Si yo quiero ver cuantas facultades dan los mismos estudios no es fácil saberlo. Siempre llega un punto que si quieres hacer algo que no esté precisamente ligado a los datos concretos tienes un problema.

Otro tema es el de la privacidad. Cuantos más datos tengas y puedas perfilar más la información, mejores conclusiones podrás obtener. Pero las universidades tienen un cierto principio de cautela para no filtrar información personal de los estudiantes. Sin embargo, aquellos datos de carácter no personal deberían ser compartidos.  Eso es lo que te permite generar valor sobre algo en concreto. 

Como estudiante del máster universitario de Ciencia de Datos ha sido un orgullo ver que se reconozcan estos estudios dentro de un concurso abierto como el de UniversiDATA.

¿Están posicionándose las universidades como referentes en ciencia abierta? Desde tu perspectiva cómo alumno, ¿te has encontrado con centros en los que se impulse la ciencia abierta?

La UOC tiene una orientación clara con la línea de ciencia abierta. Las tesis se comparten en abierto. Pero hay ciertas universidades se niegan a compartirlas. Es curioso porque creo que deberían compartir conocimiento para verificar, replicar o si se diera el caso refutar las publicaciones. La ciencia abierta es un planteamiento clave. Desde Europa se obliga a compartir datos cuando las investigaciones se sufragan con dinero público. La base del conocimiento científico es compartir lo que tú has creado para permitir su verificación. Si no se pueden acceder a las fuentes, datos y procedimiento, difícilmente podrán verificarse los distintos avances en cada campo.

¿Qué han aportado tus estudios en la UOC al proyecto «Educación situada – Cómo reducir la huella de carbono con datos abiertos universitarios»?

Por un lado, toda la parte de organización y estructura del proyecto. Después de haber hecho varios ejemplos y prácticas, el flujo de trabajo general me ha sido útil a nivel metodológico. También algo de programación ha sido de gran utilidad, sobre todo en Python. La asignatura de visualización de datos ha permitido que el resultado sea mejor. 

¿Cómo ha sido tu experiencia como alumno de máster de la UOC?

Estoy muy contento. Una parte buena del trimestre es que la UOC tiene un punto individual. Estás trabajando tú solo, con prácticas, materiales, foro… Mientras desarrollaba el proyecto estaba realizando prácticas con otro compañero, Kevin, lo cual resultó muy positivo. Me está gustando. Tengo una sensación rara: estoy estudiando mucho, pero siempre queda mucho por aprender y es todo nuevo.

Además, has presentado un nuevo proyecto que forma parte de tu TFM, podrías explicarnos en qué consiste ‘Abriendo los datos abiertos’.

El proyecto de fin de máster tiene que ver con datos abiertos. En diciembre se cumple el décimo aniversario de la Ley 19/2013 de transparencia, acceso a la información pública y buen gobierno. A partir de entonces se establecen las bases para la difusión de datos abiertos. Una de las cosas que se ha visto es que el potencial es enorme, pero lo que se extrae de los datos abiertos es limitado. Desde mi experiencia lo que he encontrado es que muchos de conjuntos de datos contienen errores que dificultan el trabajo con ciencia de datos. Un ejemplo: analizaba los contratos del Ayuntamiento de Barcelona, eso debería ayudar a que la ciudadanía tenga una mayor transparencia de lo que sucede en la Administración Pública. Cuando yo traté de visualizar estos datos, descubrí que los últimos cinco años los ficheros tenían formatos diferentes de columnas. Las fechas, en función de la gerencia, también tenían formatos distintos (formato numérico/texto/configuración regional diferente). También había campos calculados que informaban respecto al porcentaje en el que se había modificado el contrato, en algunos salía la cantidad y en otros nada, sin ninguna explicación adicional. Esto tiene un efecto perverso. Si necesitas tanto tiempo para procesarlos y entenderlos, desaparece la utilidad real de los mismos. 

Mi trabajo busca mejorar la calidad global de estos conjuntos de datos abiertos, ya que he descubierto que no hay una metodología estandarizada para ayudar al ciudadano a trabajar y leer esos datos. Ahora mismo también investigo qué herramientas de código abierto pueden ayudar a los ciudadanos. De esta forma resultará más sencillo para cualquiera tomar un conjunto de datos abiertos y transformarlo hasta llegar a un conjunto de datos que facilite la rendición de cuentas y el análisis de lo que está pasando. 

(Visited 68 times, 1 visits today)
Autor / Autora
Periodista
Comentarios
Deja un comentario