La farmacogenética: una de las aplicaciones médicas de la bioinformática

4 julio, 2022

En este entrada del blog aprovechamos para entrevistar a Laura Macías Muñoz, recién titulada del máster universitario en Bioinformática y Bioestadística ofrecido por la Universitat Oberta de Catalunya (UOC) y la Universitat de Barcelona (UB). Laura presentó su Trabajo de Fin de Máster (TFM) sobre la Exploración de la influencia de la Farmacogenética en la diversidad de respuesta al tratamiento del glaucoma mediante técnicas de machine learning el pasado mes de enero. Laura realizó el TFM mediante un convenio con el centro de investigación IDIBAPS, donde tuvo la supervisión de la Dra. Mercè Brunet, y la supervisión académica del Dr. José Luis Villanueva-Cañas.

Mientras que en esta entrada previa, vimos de la mano de nuestro titulado Manuel Guillermo como se usaban técnicas de machine learning para la búsqueda de fármacos antivirales, en esta entrada veremos otros usos que tienen las técnicas de machine learning en la farmacogenética. Concretamente, veremos cómo estas técnicas pueden ser útiles para predecir en qué pacientes un fármaco podría generarle efectos secundarios graves, así como en qué pacientes un fármaco podría tener una respuesta muy baja o nula.

¿Podrías explicarnos cuál fue la motivación en la elección del tema de tu TFM?

La implementación de la farmacogenética en el ámbito sanitario está en pleno desarrollo. En mi lugar de trabajo, en la Sección de Farmacología y Toxicología del Hospital Clínico de Barcelona, se realizan de forma asistencial estudios farmacogenéticos en diversos campos de la medicina, destinados a conseguir un tratamiento personalizado para cada paciente. En este contexto, vi la oportunidad de aplicar mis conocimientos sobre explotación de datos mediante técnicas de machine learning, útiles para establecer relaciones entre distintas variables con eventos clínicos. En nuestro caso, los enfocamos hacia el tratamiento farmacológico del glaucoma, pero existen estudios farmacogenéticos en los que se utilizan técnicas de machine learning con fármacos antitumorales, antipsicóticos, antidepresivos… entre otros.

En tu caso, realizaste el TFM con el centro IDIBAPS. ¿Podrías explicarnos cómo se estableció esta colaboración?

Uno de mis directores del TFM, la Dra. Mercè Brunet, forma parte del grupo de investigación de IDIBAPS llamado Trasplante de hígado y viabilidad del injerto, en el que estudian, entre otros biomarcadores, el rol de farmacogenética y la farmacogenómica en el tratamiento de los pacientes trasplantados de órganos sólidos. Con este background, me ofreció la posibilidad de aplicarlo al terreno del glaucoma.

¿Podrías darnos una breve explicación sobre la temática en qué se centró tu TFM sobre farmacogenética?

El glaucoma es la principal causa de ceguera irreversible a nivel mundial y se estima que afecta a más de 76 millones de personas. En los últimos años, los agentes betabloqueantes y los análogos tópicos de prostaglandinas se han convertido en fármacos de primera línea para el tratamiento del glaucoma.

Sin embargo, el uso de estos fármacos en la práctica clínica puede ir acompañado de efectos secundarios graves, lo que en cierta medida limita su uso en la práctica diaria y existe un porcentaje nada despreciable de pacientes con respuesta baja o nula. El objetivo general del trabajo fue la evaluación de diferentes herramientas de clasificación para identificar las variables más relevantes en la predicción del fracaso terapéutico y la susceptibilidad a padecer reacciones adversas al tratamiento farmacológico del glaucoma, empleando una base de datos propia constituida por pacientes atendidos en el Instituto Clínico de Oftalmología (ICOF).

¿Qué técnicas de machine learning has usado para realizar este análisis?

Para identificar las variables que caracterizaban mejor a los individuos no respondedores a la medicación, y aquellos con una mayor susceptibilidad a presentar efectos adversos, se emplearon diferentes algoritmos de aprendizaje automático supervisados, como Naïve Bayes, Regresión Logística y Random Forest.

¿Qué elementos de las técnicas de machine learning consideras importantes a la hora de elegir entre una u otra técnica?

El objetivo del machine learning es crear un modelo que nos permita resolver una tarea determinada. Este modelo se entrena utilizando gran cantidad de datos, de los que aprende y a partir de los cuales puede hacer predicciones. Según la tarea que se quiera realizar, será más adecuado trabajar con determinados algoritmos.

Un buen punto de partida para elegir la técnica más conveniente es tener claro el objetivo final. Si los datos están etiquetados y se conoce la variable respuesta, se emplearán técnicas de aprendizaje automático supervisado, las cuales pretenden encontrar una función que, dadas las variables de entrada, les asigne la etiqueta de salida adecuada. Por el contrario, si se desconoce el resultado y el objetivo de la investigación es revelar la estructura subyacente de los datos, se emplearán técnicas de aprendizaje no supervisado. El aprendizaje supervisado se suele usar en problemas de clasificación y en problemas de regresión, en función de la naturaleza de la variable respuesta (categórica o numérica, respectivamente). Ejemplos de algoritmos de machine learning supervisado aplicados a variables categóricas pueden ser la Regresión Logística, Naïve Bayes, SVM o Redes Neuronales. Entre los métodos de regresión, cabe mencionar la Regresión lineal, los Métodos Lineales Generalizados o los Árboles de Regresión.

Otro aspecto que me parece especialmente importante es el tamaño muestral del que se dispone. El uso del aprendizaje automático en conjuntos de datos de pequeño tamaño plantea un problema, ya que la potencia del aprendizaje automático en el reconocimiento de patrones es proporcional al tamaño del
conjunto de datos. Esto es especialmente cierto en algoritmos de Deep Learning, aunque en los algoritmos de aprendizaje automático tradicional también puede tener impacto.

¿Podrías explicarnos a qué conclusiones has llegado tras la finalización del trabajo?

El objetivo de mi TFM fue explorar la aplicación de métodos de aprendizaje automático en la clasificación y predicción de la respuesta al tratamiento farmacológico y de la aparición de efectos adversos derivados del tratamiento farmacológico en individuos con glaucoma. El mayor reto al que me enfrenté al trabajar en este proyecto fue tratar con datos reales de gran complejidad que requirieron un proceso minucioso y preciso de gestión de la información para identificar los valores que faltaban y los errores de codificación, que en ocasiones llevaron a eliminar observaciones no utilizables. Además, dada la cantidad de datos ausentes, el número de observaciones completas utilizables fue reducido, lo que dificultó la obtención de conclusiones robustas en los análisis estadísticos realizados.

Una de las conclusiones extraídas fue que los métodos de aprendizaje automático pueden discriminar correctamente a los pacientes respondedores y no respondedores al tratamiento, pero solo si se incluyen en los modelos variables tanto farmacogenéticas, como clínicas y demográficas. Las variables más determinantes fueron el tratamiento, el género, y el genotipado de los SNPs rs3766355 y rs3753380 en el gen PTGFR. Además, los métodos de aprendizaje automático mostraron un rendimiento satisfactorio a la hora de clasificar a los pacientes que presentaban efectos adversos. De entre todos los predictores más influyentes, cabe destacar el tipo de tratamiento y la variable farmacogenética rs16947, descrita en estudios publicados como relacionada con la aparición de bradicardia secundaria al tratamiento con el betabloqueante timolol. Estos resultados, aunque preliminares, muestran la importancia la farmacogenética y de realizar un procesamiento de los datos adecuado para estratificar a los pacientes correctamente y conseguir un buen perfil de eficacia y seguridad del tratamiento farmacológico.

Has realizado tu trabajo focalizándote en el glaucoma. ¿Has identificado otras enfermedades donde podría ser útil este tipo de estudio?

Así es. Existen recientes publicaciones que describen como en el machine learning ha demostrado un rendimiento satisfactorio en la predicción de la respuesta a fármacos en varios campos, como el cáncer, la depresión o la terapia anticoagulante. Así, por ejemplo, Truda y colaboradores [1] generaron un modelo basado en Regresión de Soporte Vectorial para predecir la dosis más adecuada del anticoagulante warfarina. Maciukiewicz [2], por su parte, evaluó un modelo basado en SVM para predecir la respuesta al antidepresivo duloxetina empleando datos obtenidos mediante GWAS como predictores con resultados satisfactorios.

¿Qué asignaturas del máster consideras que te han sido más útiles para el desarrollo de tu trabajo?

Principalmente, me ayudó lo aprendido en las asignaturas Software para el análisis estadístico, a partir de la cual conocí y profundicé en el uso de R como herramienta para el análisis de datos; o Machine Learning, que me abrió la puerta al complejo mundo del aprendizaje automático.

¿Qué consejos le darías a futuros estudiantes del máster que tengan que realizar su TFM?

En mi caso, tuve la oportunidad de realizar mi TFM en una materia asociada a mi profesión y de actualidad, como es la farmacogenética. Esta es una disciplina de la que aún queda mucho por investigar y en la que el machine learning puede ayudar a su integración como herramienta de medicina personalizada. Por ello, a los estudiantes les aconsejaría que eligieran un TFM que les permita profundizar en algún ámbito relacionado con su trabajo porque podrán sacar provecho de ello más allá del propio TFM.

Referencias:

[1] Truda, G.; Marais, P. Evaluating warfarin dosing models on multiple datasets with a novel software framework and evolutionary optimisation. J. Biomed. Inform. 2021, 113, 103634.

[2] Maciukiewicz, M.; Marshe, V.S.; Hauschild, A.-C.; Foster, J.A.; Rotzinger, S.; Kennedy, J.L.; Kennedy, S.H.; Müller, D.J.; Geraci, J. GWAS-based machine learning approach to predict duloxetine response in major depressive disorder. J. Psychiatr. Res. 2018, 99, 62–68.

(Visited 218 times, 1 visits today)

Autor / Autora

Carles Ventura Royo
Informática, Multimedia y Telecomunicación

Twitter @carles_ventura

Comentarios

Deja un comentario