Imagen de IA para la estratificación pronóstica de pacientes con Hipercolesterolemia

IA para la estratificación pronóstica de pacientes con Hipercolesterolemia

La Hipercolesterolemia Familiar (FH) es la principal causa genética de enfermedad cardiovascular aterosclerótica temprana y agresiva, que afecta a unos 30 millones de pacientes en todo el mundo, de los cuales 6,4 millones tienen menos de 14 años (38.000 en Cataluña – 7.500 niños). Las técnicas de Inteligencia Artificial (IA) pueden ayudar a definir algoritmos destinados a detectar a individuos con un riesgo extremadamente alto y personalizar el tratamiento, facilitando el cambio de una medicina reactiva a una proactiva.

Desarrollo de un algoritmo de la Inteligencia Artificial para la estratificación pronostica de los pacientes con Hipercolesterolemia Familiar con diagnóstico genético

Por Alberto Zamora Cervantes

Alumno de la 3ª edición del Máster en Big Data Sanitario y Médico Internista de la Unidad de Riesgo Vascular de la Corporació de Salut del Maresme i la Selva, Blanes, Girona

Objetivo principal: Mejorar la predicción en la estratificación de riesgo de ECV en pacientes con HF genéticamente positiva mediante la aplicación de un algoritmo de IA-ML supervisado.

Objetivos operativos: Desarrollar un prototipo de evaluación de riesgo de ECV basado en IA-ML de pacientes con riesgo de ECV.

Comparar el prototipo obtenido con el Gold-estandar: SAFEHEART-RE score.

Metodología: El modelo se desarrollará mediante IA-Machine Learning de aprendizaje supervisado con mettología CRISP-DM

Definición de modelo: Entrada: HF; clasificador de salida: MACE

Se utilizará el lenguaje de programación Python y librerías Pandas. Data set utilizado: Base de datos utilizada es el Registro de Dislipemias (RIHAD) de la Sociedad Española de Arteriosclerosis (SEA).

Población a estudio:

N: 1764 pacientes con HF genéticamente +; 913 (51.7 %) mujeres; N: 127 inmigrantes (7.19%);

N: 101 variables; Output- MACE: N: 264 (14.96%)Resultados. Métricas y modelos:

Resultados. Métricas y modelos:

  • KNN-F1 score: MACE + 0.33 / MACE – 0.91. AUC: 0.22
  • Logistic regressión F1 score: MACE + 0.27 / MACE – 0.91. AUC: 0.17
  • Random Forest:  F1 score: MACE + 0.22 / MACE – 0.91 AUC: 0.12
Hipercolesterolemia

Conclusiones

  • Los algorimos IA-ML obtenidos mediante los modelos utilizados no mejoran la predicción de riesgo de enfermedad cardio-vascular respecto al score clínico utilizado actualmente (SAFEHEART-RR) en pacientes con HF genéticamente positiva.
  • En los modelos utilizados existe divergencia entre los resultados F1-score y el AUC con una alta especifidad y baja sensibilidad lo que limita su traslación a la clínica en el momento actual.
  • Existen diferencias respecto en las métricas obtenidas en mujeres y hombres que abre una interesante línea de investigación en el intento de evitar sesgos por sexo y género en el uso de la IA.
  • El dataset utilizado, basado en un registro de la práctica clínica real con múltiples investigadores, está disbalanceado, presenta un número importante de missings, contiene datos multicotómicos y variabilidad en la introducción de los datos nominales, al ser en formato campo libre, lo que ha conllevado una mayor dificultad en el análisis de los datos.
  • Probablemente en las variables seleccionadas hay un problema importante de multicolinealidad y el reto es corregirlo en modelos posteriores en los futuros ciclos de refinamiento del algoritmo.

Si quieres ver la presentación del proyecto de Alberto pincha aquí.