Big Data Analytics aplicado en salud en redes sociales

22 marzo, 2022
Foto: Tracy Le Blanc en Pexels.

El pasado 10 de febrero tuvimos la oportunidad de contar con el profesor asociado de la Universitat Oberta de Catalunya (UOC) Miguel Ángel Mayer para que nos hablara sobre la investigación de las redes sociales en salud a través del Big Data Analytics en un webinar que enregistramos y que podéis visualizar a continuación:

Como podréis ver en vídeo, Miguel Ángel dividió su ponencia en tres grandes bloques:

  • ¿Qué es el Big Data Analytics?
  • Aplicaciones en salud del Big Data Analytics y Social Media
  • Casos de uso

En relación al Big Data Analytics, más allá de las conocidas 6V’s (Volume, Velocity, Variety, Veracity, Variability y Value), cabe destacar los distintos tipos de Big Data Analytics que se definen:

  • Prescriptivo: decidir qué acciones se deberían tomar y centrarse en respuestas específicas
  • Predictivo: Predecir sucesos que ocurrirán en el futuro
  • Diagnóstico: Analizar datos del pasado para ver qué soluciones se pueden encontrar
  • Descriptivo: Describir que está sucediendo actualmente para predecir acciones a corto plazo en el tiempo

Relacionado con el ámbito de salud en el que nos interesa centrarnos para el uso de herramientas de Big Data Analytics, conviene definir los siguientes conceptos:

  • Real World Data: Se define como los datos procedentes de múltiples fuentes que pueden ser de origen muy heterogéneo. Algunos ejemplos de estos tipos de datos pueden ser biomarcadores, datos de mortalidad, datos de hospitales, resultados de encuestas, registros de enfermedades, dispositvos wearables o datos de redes sociales, entre muchos otros. En este webinar prestaremos especial atención a estos últimos tipos de datos, los de las redes sociales.
  • Real World Evidence: Se define como las evidencias que se obtienen a partir de analizar los Real World Data con el uso de herramientas bioinformáticas y bioestadísticas.

¿Qué tipo de información sobre salud podemos encontrar en las redes sociales?

Nos encontramos que cada vez hay más personas que usan las plataformas de redes sociales (Twitter, Facebook, Instagram…) para compartir experiencias, pensamientos y sentimientos sobre su día a día. Esto ha hecho que las redes sociales se hayan convertido en una importante fuente de información sobre salud que se genera sin ser solicitada, de forma espontánea y permanentemente actualizada.

El estudio de los datos generados por canales no formales (entendemos por canales formales los datos que proceden directamente del registro en hospitales, centros de asistencia, laboratorios, etc.) tales como las redes sociales constituye lo que se conoce como epidemiología digital. El análisis de este tipos de datos publicados en redes sociales permite detectar condiciones diferentes, uso de drogas o efectos secundarios de medicamentos que podrían no haberse detectado mediante el análisis de datos procedentes de los canales formales.

En la actualidad las interacciones online que facilitan los dispositivos digitales generan todo un rastro de datos que nos permiten obtener información en tiempo real de diferentes contextos de la vida diaria, que pueden influir en la salud de las personas. De esta forma se amplia el concepto de fenotipo con el fenotipo digital, resultando el fenotipo extendido que tiene en cuenta estas interacciones, reformulando la manera en la que experimentamos y entendemos la enfermedad.

¿Qué casos de uso podemos considerar?

Uno de los casos de uso más extendidos en el uso de Big Data Analytics para salud en redes sociales que podemos encontrar es la depresión. Existen distintos trabajos científicos publicados que intentar detectar señales de depresión de usuarios en distintas plataformas, tales como Instagram, Twitter o Facebook. Un ejemplo seria el uso de herramientas de Procesado del Lenguaje Natural conjuntamente con técnicas de aprendizaje automático para un análisis afectivo a nivel de emociones de los contenidos textuales publicados por usuarios. Así pues, podemos encontrar trabajos que han identificado usuarios que se declaran como depresivos en su propio estado y otros usuarios que no padecen este estado depresivo para formar bases de datos que permitan encontrar automáticamente los patrones característicos que permitan predecir si un nuevo contenido publicado por un usuario corresponde o no a un estado depresivo.

Existen también otros casos de uso, como el análisis de síntomas de COVID-19 por pacientes que reportan su estado a través de las redes sociales o los efectos de la vacunación por sarampión.

¿Qué aspectos éticos y de privacidad hay que considerar?

Si bien es cierto que los usuarios de estas plataformas eligen libremente publicar esta información personal en las redes sociales y, por lo tanto, es accesible por parte de cualquier persona, cabe considerar ciertos aspectos éticos en el uso de este tipo de información.

Aunque los datos de salud se consideran un tipo de información muy sensible y que legalmente pertenece a los pacientes, la realidad es que actualmente no existe un acuerdo unánime entre los profesionales de la salud sobre como se deben manejar algunas situaciones que surgen a partir del análisis de datos procedentes de las redes sociales.

Así pues, parece claro que es necesario establecer estándares de gobernanza sobre este tipo de datos que tengan en consideración todos estos aspectos éticos y de privacidad que conciernen a los datos publicados en redes sociales relativos a la salud. Este es un aspecto que no únicamente lo encontramos en el ámbito de la salud, sino que cada vez más vemos que ética e inteligencia artificial son dos elementos claves que no podemos disociar el uno del otro.

Estos (Big Data Analytics en Salud) y otros temas son algunas de las líneas de investigación que se proponen para los trabajos fin de máster para nuestros estudiantes del máster universitario de Bioinformática y Bioestadística que ofrecemos conjuntamente la UOC y la UB.

(Visited 72 times, 1 visits today)
Autor / Autora
Carles Ventura
Profesor de los Estudios de Informática, Multimedia y Telecomunicación de la UOC y director del máster universitario de Bioinformática y Bioestadística (interuniversitario: UOC, UB). 
Comentarios
Deja un comentario