«Esta experiencia ha sido el primer contacto con un proyecto real de tratamiento y análisis de datos»

25 octubre, 2022
Alba Malagón y Aina Martí.

(Més avall trobareu la versió en català d’aquest contingut: «Aquesta experiència ha estat el primer contacte amb un projecte real de tractament i anàlisi de dades».)

Alba Malagón Márquez y Aina Martí Aranda son graduadas en Bioinformática y actualmente están cursando el máster universitario de Ciencia de Datos (Data Science) de la UOC. Hace unas semanas consiguieron el tercer lugar del Datathon Digital Health (Data4Health) y nos han contado su experiencia como ganadoras de este premio de salud digital.

¿En qué consiste el Datathon Digital Health (Data4Health)?

El Datathon Digital Health (Data4Health) es un evento organizado por Dedalus para desarrollar soluciones que puedan abordar los desafíos de datos a los que se enfrenta la sanidad en la actualidad. Es una competición abierta, con una limitación temporal, en la que se trabaja en equipos de tres a cinco personas. Todos los retos propuestos responden a necesidades reales de las organizaciones de salud y farmacéuticas del ecosistema de salud de Cataluña. En nuestro caso, quisimos aportar una solución al reto «Exploración de las capacidades de reclutamiento de pacientes en ensayos clínicos federados».

¿Cómo os enterasteis de la existencia de este evento?

Nos enteramos a través de la publicación hecha por diferentes universidades en las redes sociales, en concreto, ESCI-UPF y la UOC. De entrada, nos llamó la atención el título, que asociamos con nuestros conocimientos de bioinformática, ámbito en el que también se utilizan datos relacionados con la salud. Esto hizo que nos informáramos sobre cómo funcionaba el concurso, qué pedían y qué podíamos aportar.

¿Por qué decidisteis participar?

Porque vimos una clara oportunidad de aplicar todo lo que hemos aprendido a lo largo de nuestros estudios, tanto en la carrera como ahora en el máster. Además, nos pareció una buena ocasión para hacer contactos y darnos a conocer con gente reconocida dentro del ámbito. Naturalmente, la recompensa económica de los premiados también fue un punto a favor a la hora de participar.

Hicisteis grupo con otro estudiante. ¿Os conocíais de antes? ¿Cómo os organizasteis?

El tercer integrante del grupo, Adrià Cabello, fue compañero nuestro durante el grado de Bioinformática; por lo tanto, ya habíamos realizado proyectos con él. Teniendo en cuenta que era un proyecto de solo tres días y, que, además, eran laborables, tuvimos que coincidir por videollamada. Durante el planteamiento del proyecto, aportamos ideas de forma conjunta y, a partir de ahí, nos dividimos las tareas de forma individual para poder trabajar en paralelo; así conseguimos ser más eficientes. Una vez pusimos en común el trabajo hecho, extrajimos los resultados y conclusiones conjuntamente. A pesar de haber trabajado remotamente, la defensa del proyecto fue presencial en Tech Barcelona.

Contadnos brevemente de qué iba vuestro proyecto.

Desde Dedalus nos plantearon el reto de extraer conocimiento de un conjunto de datos que pudiera ayudar a reclutar pacientes para ensayos clínicos federados. En primer lugar, es importante destacar la dificultad de reclutar en determinados ensayos por el hecho de que los pacientes deben seguir un patrón de características, y los criterios no suelen ser fáciles. Nuestra estrategia consistió en desarrollar un algoritmo de clasificación binaria que permitiera identificar si un paciente tiene una enfermedad determinada, algo que resulta útil para un ensayo clínico que busque esta característica en los pacientes. Por tanto, nuestro trabajo consistió en la limpieza y preparación de los datos para la posterior construcción de modelos clasificatorios de calidad. Al mismo tiempo, presentamos nuestro proyecto en el contexto de un sistema federado, y mostramos, de este modo, las futuras líneas de trabajo posibles y varias formas de mejorar los pocos resultados que pudimos obtener en el tiempo que se nos proporcionó.

¿Qué dificultades encontrasteis durante el desarrollo?

A pesar de que el objetivo del reto parecía muy claro, nos dieron mucha libertad para enfocarlo del modo que viéramos más factible, a partir de los datos que teníamos. Esto comportó ventajas e inconvenientes. Era un conjunto muy limitado y con datos complejos que, a su vez, no estaban almacenados de forma adecuada. Además, los datos que contenía proporcionaban poca información clave y directamente relacionada con los ensayos clínicos. Por lo tanto, encontrar una solución a partir de estos datos fue más difícil de lo que esperábamos. Si a esto le sumamos la limitación temporal de tres días, ¡podemos decir que fue un gran reto!

¿Qué significó para vosotros conseguir el tercer premio?

Al inicio del proyecto tuvimos muchas dudas sobre si estaríamos a la altura de lo que se nos pedía, puesto que el reto resultó ser mucho más complejo de lo que esperábamos en un principio. Finalmente, ganar el tercer premio significó mucho para nosotros: todas las horas invertidas y el trabajo hecho tuvieron su recompensa, pero, sobre todo, nos hicieron ver que sí éramos capaces de resolver el reto, por complicado que resultara.

Alba Malagón y Aina Martí en el centro de la foto recogiendo el tercer premio.

Además del premio, ¿qué os lleváis de esta experiencia?

Para nosotros, esta experiencia ha sido el primer contacto con un proyecto real de tratamiento y análisis de datos, así como el primer contacto con una empresa como Dedalus, que se dedica al tratamiento de datos en salud. De todo esto, nos llevamos una experiencia muy enriquecedora por el hecho de compartir conocimientos con profesionales del sector.

¿Qué os pareció la organización?

La organización estuvo a la altura en todo momento. Desde el principio, abrieron un espacio en Slack que nos permitía estar en contacto entre todos los equipos y mentores para resolver posibles dudas que nos surgieran. También hay que destacar la presencia de profesionales de diferentes ámbitos, que se centraban en dudas más especializadas. Asimismo, cabe remarcar el elaborado evento que organizaron para presentar los proyectos. A pesar de defenderlo ante personas muy importantes en el ámbito, nos sentimos muy acogidos y cómodos en todo momento.

¿Recomendaríais a alguien participar en la futura edición del Datathon Digital Health? ¿Por qué razones?

Sí, sin duda. También repetiríamos. Es una experiencia muy enriquecedora, que puede proporcionarte contactos y que te permite darte a conocer ante gente reconocida dentro del ámbito, a pesar de no ganar ningún premio. Además, es una buena ocasión para introducirte en proyectos reales que tratan con datos reales.

«Aquesta experiència ha estat el primer contacte amb un projecte real de tractament i anàlisi de dades»

Alba Malagón i Aina Martí.

Alba Malagón Márquez i Aina Martí Aranda són graduades en Bioinformàtica i actualment cursen el màster universitari de Ciència de Dades (Data Science) de la UOC. Fa unes setmanes van aconseguir el tercer lloc del Datathon Digital Health (Data4Health) i ens han explicat la seva experiència com a guanyadores d’aquest premi de salut digital.

En què consisteix el Datathon Digital Health (Data4Health)?

El Datathon Digital Health (Data4Health) és un esdeveniment organitzat per Dedalus per desenvolupar solucions que puguin abordar els desafiaments de dades a què s’enfronta la sanitat en l’actualitat. És una competició oberta, amb una limitació temporal, en què es treballa en equips de tres a cinc persones. Tots els reptes proposats responen a necessitats reals d’organitzacions de salut i farmacèutiques de l’ecosistema de salut de Catalunya. En el nostre cas, vam voler aportar una solució al repte «Exploració de les capacitats de reclutament de pacients en assajos clínics federats».

Com us vau assabentar de l’existència d’aquest esdeveniment?

Ens en vam assabentar a través de la publicació feta per diferents universitats a les xarxes socials, en concret, ESCI-UPF i la UOC. D’entrada, ens va cridar l’atenció el títol, que vam associar amb els nostres coneixements de bioinformàtica, àmbit en què també s’utilitzen dades relacionades amb la salut. Això va fer que ens informéssim de com funcionava el concurs, què demanaven i què hi podíem aportar.

Per què vau decidir participar-hi?

Perquè vam veure una clara oportunitat d’aplicar tot el que hem après al llarg dels estudis, tant a la carrera com ara al màster. A més, ens va semblar una bona ocasió per fer contactes i donar-nos a conèixer amb gent reconeguda dins l’àmbit. Naturalment, la recompensa econòmica dels premiats també va ser un punt a favor a l’hora de participar-hi.

Vau fer grup amb un altre estudiant. Us coneixíeu abans? Com us vau organitzar?

El tercer integrant del grup, l’Adrià Cabello, havia estat company nostre durant el grau de Bioinformàtica, de manera que ja havíem fet projectes amb ell. Tenint en compte que era un projecte de només tres dies i que, a més, eren laborables, vam haver de coincidir per videotrucada. Durant el plantejament del projecte, vam aportar idees de manera conjunta i, a partir d’aquí, ens vam dividir les tasques de manera individual per poder treballar en paral·lel; així vam aconseguir ser més eficients. Un cop vam posar en comú la feina feta, vam extreure els resultats i les conclusions conjuntament. Tot i haver treballat remotament, la defensa del projecte va ser presencial a Tech Barcelona.

Expliqueu-nos breument de què anava el vostre projecte.

Des de Dedalus ens van plantejar el repte d’extreure coneixement d’un conjunt de dades que pogués ajudar a reclutar pacients per a assajos clínics federats. En primer lloc, és important destacar la dificultat de reclutar en determinats assajos pel fet que els pacients han de seguir un patró de característiques, i els criteris no solen ser fàcils. La nostra estratègia va consistir a desenvolupar un algorisme de classificació binària que permetés identificar si un pacient té una malaltia determinada, cosa que resulta útil per a un assaig clínic que busqui aquesta característica en els pacients. Per tant, la nostra feina va consistir en la neteja i preparació de les dades per a la posterior construcció de models classificatoris de qualitat. Alhora, vam presentar el projecte en el context d’un sistema federat, i vam mostrar, d’aquesta manera, les futures línies de treball possibles i diverses maneres de millorar els pocs resultats que vam poder obtenir en el temps que se’ns va proporcionar.

Quines dificultats vau trobar durant el desenvolupament?

Tot i que l’objectiu del repte semblava molt clar, ens van donar molta llibertat per enfocar-lo de la manera que veiéssim més factible, a partir de les dades que teníem. Això va comportar avantatges i inconvenients. Era un conjunt molt limitat i amb dades complexes que alhora no estaven emmagatzemades de manera adequada. A més, les dades que contenia proporcionaven poca informació clau i directament relacionada amb els assajos clínics. Per tant, trobar una solució a partir d’aquestes dades va ser més difícil del que ens esperàvem. Si hi sumem la limitació temporal de tres dies, podem dir que va ser un gran repte!

Què va significar per a vosaltres aconseguir el tercer premi?

Al començament del projecte vam tenir molts dubtes sobre si estaríem a l’altura del que se’ns demanava, ja que el repte va resultar ser molt més complex del que ens esperàvem en un principi. Finalment, guanyar el tercer premi va significar molt per a nosaltres: totes les hores invertides i el treball fet van tenir recompensa, però, sobretot, ens van fer veure que sí que érem capaços de resoldre el repte, per complicat que resultés.

Alba Malagón i Aina Martí al centre de la foto recollint el tercer premi.

A més del premi, què us emporteu d’aquesta experiència?

Per a nosaltres, aquesta experiència ha estat el primer contacte amb un projecte real de tractament i anàlisi de dades, i també el primer contacte amb una empresa com Dedalus, que es dedica al tractament de dades en salut. De tot això, ens emportem una experiència molt enriquidora pel fet de compartir coneixements amb professionals del sector.

Què us va semblar l’organització?

L’organització va estar a l’altura en tot moment. Des del principi, van obrir un espai a Slack que ens permetia estar en contacte entre tots els equips i mentors per resoldre possibles dubtes que ens sorgissin. També cal destacar la presència de professionals de diferents àmbits, que se centraven en dubtes més especialitzats. Així mateix, cal remarcar l’elaborat esdeveniment que van organitzar a l’hora de presentar els projectes. Tot i defensar-lo davant de persones molt importants en l’àmbit, ens vam sentir molt acollits i còmodes en tot moment.

Recomanaríeu a algú participar en la futura edició del Datathon Digital Health? Per quines raons?

Sí, sens dubte. També repetiríem. És una experiència molt enriquidora que et pot proporcionar contactes i que et permet donar-te a conèixer davant de gent reconeguda dins l’àmbit, tot i no guanyar cap premi. A més, és una bona ocasió per introduir-te en projectes reals que fan servir dades reals.

(Visited 102 times, 1 visits today)
Autor / Autora
Periodista colaboradora de la UOC.
Comentarios
Deja un comentario