OpenAI lanza nuevo modelo de IA de “Razonamiento”, o1
OpenAI anunció hoy su último modelo de IA, o1, el primero de una nueva familia de modelos de “razonamiento” diseñados para manejar problemas complejos de manera más rápida y precisa que los modelos anteriores.
Junto con o1, la empresa también está lanzando una versión más pequeña y asequible llamada o1-mini. Este lanzamiento se describe como una “vista previa”, señalando que la tecnología aún se encuentra en sus primeras etapas.
o1, que anteriormente era conocido por el nombre en clave “Strawberry”, es el primero de una serie de modelos de “razonamiento” que OpenAI planea lanzar, según señaló TechCrunch.
Jerry Tworek, el líder de investigación de OpenAI, le dijo a The Verge que el entrenamiento detrás de o1 difiere significativamente de los modelos anteriores, aunque la empresa ha sido poco clara acerca de los detalles específicos.
A diferencia de sus predecesores, que fueron diseñados para imitar patrones a partir de datos de entrenamiento, o1 utiliza el aprendizaje por refuerzo, un método que enseña al sistema a resolver problemas a través de recompensas y sanciones.
Una de las características más llamativas de o1 es su capacidad para resolver problemas de varios pasos y escribir código con un mayor grado de precisión en comparación con los modelos anteriores.
Por ejemplo, en un examen de clasificación para la Olimpiada Internacional de Matemáticas, o1 superó al modelo GPT-4o anterior de OpenAI, resolviendo el 83% de los problemas en comparación con el 13% del GPT-4o.
Este salto en rendimiento se atribuye al nuevo proceso de entrenamiento de o1, que incorpora lo que OpenAI denomina un mecanismo de “cadena de pensamiento”, permitiendo al modelo desglosar y resolver problemas paso a paso.
Tworek señala que, aunque el modelo ha reducido su tendencia a “alucinar” o proporcionar información inexacta, el problema no se ha resuelto por completo, según informó The Verge.
Además de su habilidad matemática, o1 se clasificó en el percentil 89 en concursos de programación competitiva, demostrando su potencial como herramienta tanto para desarrolladores como para investigadores.
Según The Verge, lo que destacó fue cómo o1 parecía imitar intencionalmente el pensamiento humano. Frases como “Tengo curiosidad”, “Estoy pensando” y “Déjame ver” daban la ilusión de un proceso de pensamiento, aunque el modelo en realidad no está pensando. ¿Entonces por qué hacer que parezca que sí lo está?
The Verge informa que Tworek explica que esta interfaz está diseñada para demostrar cómo el modelo tarda más tiempo en procesar y explorar problemas con mayor profundidad.
A pesar de estos avances, OpenAI reconoce que o1 aún tiene limitaciones. Aunque sobresale en la resolución de problemas complejos, es menos hábil en el manejo de conocimientos factuales sobre el mundo. Además, carece de algunas de las características que hacen que GPT-4o sea altamente versátil, como la capacidad de navegar por la web o procesar archivos e imágenes.
Además, las nuevas capacidades de o1 tienen un coste. El modelo es significativamente más caro de usar que GPT-4o. En la API de OpenAI, o1-preview cuesta $15 por cada 1 millón de tokens de entrada y $60 por cada 1 millón de tokens de salida, lo cual es tres a cuatro veces más alto que el coste de GPT-4o.
Aunque la tecnología aún está en sus primeras etapas, el lanzamiento de o1 resalta los avances continuos en la capacidad de la IA para abordar tareas complejas, ofreciendo beneficios potenciales en diversos campos que requieren capacidades avanzadas de resolución de problemas.
Dejar un comentario
Cancelar