Según una investigación de New York Eye and Ear Infirmary of Mount Sinai (Estados Unidos) publicado en ´JAMA Ophthalmology´ un sistema de inteligencia artificial (IA) de modelo de lenguaje grande (LLM) puede igualar, o en algunos casos superar, a los oftalmólogos humanos en el diagnóstico y tratamiento de pacientes con ...
Según una investigación de New York Eye and Ear Infirmary of Mount Sinai (Estados Unidos) publicado en ´JAMA Ophthalmology´ un sistema de inteligencia artificial (IA) de modelo de lenguaje grande (LLM) puede igualar, o en algunos casos superar, a los oftalmólogos humanos en el diagnóstico y tratamiento de pacientes con glaucoma y enfermedades de la retina.
El estudio comparó el conocimiento de los especialistas en oftalmología con las capacidades del sistema de IA de última generación, GPT-4 (Generative Pre-Training-Model 4) de OpenAI, diseñado para replicar el rendimiento a nivel humano. Dentro de la medicina, las sofisticadas herramientas de IA se consideran potencialmente revolucionarias en el diagnóstico y el tratamiento gracias a la precisión y amplitud de las respuestas generadas por el LLM.
La oftalmología, con su gran volumen de pacientes a menudo complejos, podría ser un campo particularmente fértil para la IA, dando a los especialistas más tiempo para practicar la medicina basada en evidencia.
Para el lado humano de su estudio, el equipo de Mount Sinai reclutó a 12 especialistas asistentes y tres aprendices de alto nivel del Departamento de Oftalmología de la Escuela de Medicina Icahn de Mount Sinai. Se seleccionó al azar un conjunto básico de 20 preguntas (10 para glaucoma y 10 para retina) de la lista de preguntas frecuentes de los pacientes de la Academia Estadounidense de Oftalmología, junto con 20 casos de pacientes no identificados seleccionados de clínicas oftalmológicas afiliadas a Mount Sinai.
Luego, las respuestas tanto del sistema GPT-4/AI como de los especialistas humanos se analizaron estadísticamente y se calificaron según su precisión y minuciosidad utilizando una escala Likert, que se usa comúnmente en la investigación clínica para calificar las respuestas.
Los resultados mostraron que la IA igualaba o superaba a los especialistas humanos tanto en precisión como en integridad de sus consejos y evaluaciones médicas. Más específicamente, la IA demostró un rendimiento superior en respuesta a preguntas sobre glaucoma y consejos sobre gestión de casos, al tiempo que reflejó un resultado más equilibrado en preguntas sobre retina, donde la IA igualó a los humanos en precisión pero los superó en integridad.
Según los investigadores, GPT-4 puede brindar una valiosa orientación sobre cómo ser mejores médicos, especialmente en términos de cómo documentar los hallazgos de los exámenes de los pacientes. De esta forma, podría servir como un asistente confiable para los oftalmólogos brindándoles apoyo de diagnóstico y potencialmente aliviando su carga de trabajo, especialmente en casos complejos o áreas con un gran volumen de pacientes.