72 radiólogos y cuatro herramientas comerciales de IA analizaron radiografías de tórax, siendo que los humanos se mostraron más específicos en la detección de estas patologías. De falsos positivos a tasas de sensibilidad bajo la lupa.
(HealthDay News) – Las herramientas de Inteligencia Artificial (IA) pueden ayudar a aumentar la confianza de los radiólogos en sus diagnósticos, pero no se pueden confiar para identificar enfermedades pulmonares comunes en radiografías de tórax, dice un nuevo estudio.
Investigadores enfrentaron a 72 radiólogos contra cuatro herramientas comerciales de IA en un análisis de más de 2,000 radiografías. Los expertos humanos ganaron, según los resultados publicados el 25 de septiembre en la revista de radiología Radiology. ”La radiografía de tórax es una herramienta diagnóstica común, pero se requiere una formación y experiencia significativas para interpretar los exámenes correctamente”, dijo el investigador principal, el Dr. Louis Plesner, radiólogo residente y becario de doctorado en radiología en el Hospital Herlev y Gentofte en Copenhague, Dinamarca.
”Aunque las herramientas de IA están siendo cada vez más aprobadas para su uso en departamentos radiológicos, hay una necesidad insatisfecha de probarlas aún más en escenarios clínicos de la vida real”, dijo Plesner en un comunicado de prensa de la revista.
El impacto de los diagnósticos falsos positivos: Riesgos, costos y exposición innecesaria a la radiación (Imagen ilustrativa Infobae)
“Las herramientas de IA pueden ayudar a los radiólogos a interpretar radiografías de tórax, pero su precisión diagnóstica en la vida real sigue siendo incierta”. Herramientas de IA disponibles comercialmente y aprobadas por la FDA están disponibles para ayudar a los radiólogos, dijo Plesner.
En este estudio, las radiografías se habían tomado durante dos años en cuatro hospitales daneses. Aproximadamente un tercio tenía por lo menos un diagnóstico objetivo. Las radiografías se revisaron buscando tres hallazgos comunes: espacio aéreo, que es un patrón radiográfico en el tórax causado, por ejemplo, por neumonía o edema pulmonar; neumotórax, o pulmón colapsado; y derrame pleural, una acumulación de agua alrededor de los pulmones.
Las herramientas de IA tuvieron tasas de sensibilidad que variaron del 72% al 91% para detectar espacio aéreo, del 63% al 90% para neumotórax, y del 62% al 95% para derrame pleural. Una prueba altamente sensible significa que se pierden menos casos de enfermedad.El estudio encontró que los radiólogos superaron a la IA en la identificación precisa de la presencia y ausencia de las tres condiciones pulmonares comunes.
”Las herramientas de IA mostraron una sensibilidad moderada a alta comparable a la de los radiólogos para detectar padecimientos relacionados con espacio aéreo, neumotórax y derrame pleural en radiografías de tórax”, dijo Plesner. Sin embargo, produjeron más resultados falsos positivos (predecir enfermedad cuando no estaba presente) que los radiólogos, y su rendimiento disminuyó cuando estaban presentes varios hallazgos y para objetivos más pequeños.
Herramientas de IA: Avances y desafíos en el mundo de la radiología moderna
”Para el neumotórax, la probabilidad de que los pacientes con un resultado positivo en el cribado realmente tuvieran la enfermedad osciló entre el 56% y el 86% para los sistemas de IA en comparación con el 96% para los radiólogos. La IA tuvo el peor desempeño en la identificación de padecimientos del espacio aéreo, con valores predictivos positivos que oscilan entre el 40% y el 50%”, dijo Plesner.
“En esta muestra difícil y de pacientes mayores, la IA predijo padecimientos del espacio aéreo donde no estaba presente en 5 a 6 de cada 10 ocasiones. No puedes tener un sistema de IA trabajando por sí solo a esa tasa. ”El objetivo de los radiólogos es equilibrar tanto el hallazgo como la exclusión de enfermedades, evitando enfermedades significativas pasadas por alto y el sobrediagnóstico, dijo Plesner.
”Los sistemas de IA parecen ser muy buenos para encontrar enfermedades, pero no son tan buenos como los radiólogos para identificar la ausencia de enfermedad, especialmente cuando las radiografías de tórax son complejas”, dijo. “Demasiados diagnósticos falsos positivos resultarían en imágenes innecesarias, exposición a la radiación y costos elevados.
”En estudios anteriores que afirmaban la superioridad de la IA sobre los radiólogos, los radiólogos revisaron solo la imagen sin acceso a la historia clínica del paciente y estudios de imágenes anteriores. “En la práctica diaria, la interpretación de un radiólogo de un examen de imagen es una síntesis de estos tres puntos de datos”, dijo Plesner.
Más información. La Asociación Hospitalaria Americana tiene más información sobre el uso de la IA en el diagnóstico y el cuidado.