La inteligencia artificial se ha convertido en una herramienta indispensable de nuestro día a día porque nos facilita la elaboración de bastantes tareas, no obstante, hay veces que los modelos de lenguaje alucinan porque contienen informaciones arrojadas por el sistema que, aunque estén escritas de forma coherente, poseen algún dato incorrecto o directamente erróneo.

En ocasiones hemos visto fallar a determinados modelos de IA, como la inteligencia artificial de Google cuando recomendó poner pegamento en una pizza o cuando un abogado citó sentencias inexistentes inventadas por ChatGPT. Como decimos, las alucinaciones son errores que proceden de problemas en los datos de entrenamiento, fallos en los algoritmos por limitaciones, falta de contexto, interacciones con información incorrecta o complejidad para entender el mundo real. Pero, ¿por qué alucina la inteligencia artificial?

Una nueva investigación de OpenAI sostiene que “los modelos de IA alucinan porque los procedimientos estándar de entrenamiento y evaluación recompensan la conjetura en lugar del reconocimiento de la incertidumbre”. Además, la compañía de Sam Altman revela que “las alucinaciones siguen siendo un desafío fundamental para todos los modelos lingüísticos grandes”, teniendo en cuenta que OpenAI reconoce públicamente que ChatGPT también alucina, a pesar que GPT-5 presenta menos alucinaciones.

Por qué alucinan los modelos de IA

OpenAI señala que las alucinaciones persisten en parte porque los métodos de evaluación actuales establecen incentivos erróneos, y para explicarlo, compara su forma de responder con un estudiante enfrentándose a un examen de respuesta múltiple: “Si no sabes la respuesta pero intentas adivinar, podrías tener suerte y acertar. Dejarla en blanco garantiza un cero. De la misma manera, cuando los modelos se califican solo por la precisión, el porcentaje de preguntas que responden correctamente, se les anima a adivinar en lugar de decir ‘No lo sé’”.

Por lo tanto, ante este descubrimiento, OpenAI propone actualizar las pruebas basadas en la precisión para que también se penalicen las conjeturas, y que los modelos puedan “abstenerse ante la incertidumbre”. No obstante, la compañía de Altman reconoce que no se pueden conseguir modelos de lenguaje que sean precisos al cien por cien, porque “independientemente del tamaño del modelo y de sus capacidades de búsqueda y razonamiento, algunas preguntas del mundo real son inherentemente incontestables”.

Además, para corroborar dicha afirmación, OpenAI indica que, para preguntas con una única “respuesta correcta”, se pueden considerar tres categorías de respuestas —precisas, errores y abstenciones—, donde el modelo no se arriesga a adivinar, teniendo en cuenta la abstención forma parte de la humildad, uno de los valores fundamentales de OpenAI.

Los modelos IA nunca son plenamente precisos

OpenAI afirma que los modelos de IA no son 100% precisos porque, independientemente del tamaño del modelo y de sus capacidades de búsqueda y razonamiento, algunas preguntas del mundo real son incontestables. Además, reconoce que “las alucinaciones no son inevitables” porque los modelos pueden abstenerse ante la incertidumbre.

Por lo tanto, para evitar las alucinaciones, se requiere un grado de inteligencia exclusivo de los modelos grandes, ya que puede ser más fácil para un modelo pequeño conocer sus propios límites.