En los ensayos, los modelos “o1” se desempeñaron de manera comparable a los estudiantes de doctorado en tareas difíciles

14 de septiembre de 2024, 21:53 PM
14 de septiembre de 2024, 21:53 PM

El creador de ChatGPT, OpenAI, lanzó o1, una nueva línea de modelos de inteligencia artificial (IA) generativa capaz de razonar y de responder a preguntas complejas, por ejemplo de matemáticas.

A diferencia de sus predecesores, estos nuevos modelos han sido concebidos para refinar sus procesos de pensamiento, probar diferentes métodos y reconocer errores antes de proporcionar una respuesta final.

El director ejecutivo de OpenAI, Sam Altman, elogió los modelos como “un nuevo paradigma: una IA que puede realizar razonamientos complejos de propósito general”.

Sin embargo, advirtió que la tecnología “todavía tiene fallas, es limitada y parece más impresionante la primera vez que se la usa que después de pasar más tiempo con ella”.

OpenAI, respaldado por Microsoft, dijo que en los ensayos, los modelos se desempeñaron de manera comparable a los estudiantes de doctorado en tareas difíciles de física, química y biología.

También destacaron en matemáticas y codificación, logrando una tasa de éxito de 83% en un examen de calificación para la Olimpiada Internacional de Matemáticas, en comparación con el 13% de GPT-4o, su modelo de uso general más avanzado.

En un concurso de matemáticas para estudiantes de secundaria estadounidenses, o1 quedó “entre los 500 mejores”, añadió.

“Al igual que un ser humano que puede pensar mucho tiempo antes de responder una pregunta difícil, o1 utiliza una cadena de pensamiento (...) Aprende a reconocer y corregir sus errores. Aprende a descomponer las etapas más delicadas en otras más simples. Aprende a probar un enfoque diferente cuando el actual no funciona”, explicó OpenAI.

La compañía dijo que las capacidades de razonamiento mejoradas podrían usarse para que los investigadores de atención médica anoten datos de secuenciación celular, que los físicos puedan generar fórmulas complejas y los desarrolladores de computadoras sean capaces de construir y ejecutar diseños de varios pasos.

Indicó igualmente que los nuevos modelos son capaces de resistir mejor los intentos de eludir los mecanismos de seguridad.

OpenAI destacó que sus medidas de seguridad reforzadas incluían acuerdos recientes con los Institutos de Seguridad de IA de Estados Unidos y Reino Unido, a los que se les concedió acceso temprano a los modelos para su evaluación.

Pero OpenAI es solo uno más de los actores clave en la industria de tecnología que ha acelerado el desarrollo de este tipo de modelos de IA. Google, Anthropic, Meta, entre otras, también trabajan en proyectos similares, con el objetivo de crear herramientas que actúen como ‘copilotos’ en diversas tareas, aumentando su utilidad y efectividad en aplicaciones profesionales y personales.

Melanie Mitchell, profesora del Santa Fe Institute (Nuevo Mexico,) autora del libro Inteligencia artificial: una guía para humanos pensantes, sugiere que estos modelos en realidad no hacen un razonamiento profundo, sino que extraen patrones de razonamiento de problemas similares en los datos con los que fueron entrenados, es decir, simulan inteligencia.