Investigadoras construyen un modelo de IA por $50 que rivaliza con OpenAI y DeepSeek

Image by lucabravo, from Freepik

Investigadoras construyen un modelo de IA por $50 que rivaliza con OpenAI y DeepSeek

Tiempo de lectura: 3 min.

Un grupo de investigadores de IA de Stanford y la Universidad de Washington han entrenado un modelo de razonamiento de IA de alto rendimiento por menos de $50 en costos de computación en la nube, según un artículo de investigación publicado el pasado viernes, tal como informó por primera vez TechCrunch.

¿Apurada? ¡Aquí están los datos rápidos!

  • Investigadoras entrenaron un modelo de razonamiento de IA por menos de $50 en costos de computación en la nube.
  • El modelo, s1, rinde tan bien como el o1 de OpenAI y el R1 de DeepSeek.
  • s1 es de código abierto y está disponible en GitHub con sus datos de entrenamiento y código.

El modelo, llamado s1, se desempeña a la par con AIs de razonamiento avanzado como o1 de OpenAI y R1 de DeepSeek en pruebas de matemáticas y programación. Está disponible gratuitamente en GitHub, junto con los datos de entrenamiento y el código.

Para desarrollar s1, los investigadores comenzaron con un modelo de IA preexistente y lo perfeccionaron utilizando un proceso llamado destilación. Este método extrae habilidades de razonamiento de una IA más avanzada mediante el entrenamiento basado en sus respuestas.

El equipo reveló que s1 fue destilado a partir del modelo experimental de Pensamiento Rápido Gemini 2.0 de Google.

El grupo de investigadores ha construido un modelo de IA de código abierto que rivaliza con el o1-preview de OpenAI en la resolución de problemas matemáticos y lógicos complejos. ¿Su secreto? Un simple truco que da a la IA más tiempo para pensar antes de responder.

El método, llamado “forzamiento de presupuesto”, funciona haciendo que la IA realice pasos adicionales al resolver problemas en lugar de apresurarse a responder. Al darse más tiempo, la IA puede revisar su trabajo y mejorar la precisión.

El equipo entrenó su modelo, llamado s1-32B, utilizando solo 1,000 preguntas de ejemplo cuidadosamente seleccionadas con explicaciones paso a paso.

A pesar de este pequeño conjunto de datos, el modelo superó al o1-preview de OpenAI en pruebas de matemáticas complejas, como MATH y AIME24, mejorando los resultados hasta en un 27%. Incluso logró aumentar su propia puntuación en una prueba del 50% al 57% simplemente pensando más antes de finalizar las respuestas, sin ningún entrenamiento adicional.

Esto es muy importante porque la mayoría de las mejoras en IA dependen de enormes cantidades de nuevos datos de entrenamiento. En cambio, esta investigación sugiere que muchos modelos de IA ya tienen habilidades de razonamiento sólidas ocultas en su interior: solo necesitan las técnicas adecuadas para desbloquearlas.

El estudio también probó diferentes formas de extender el tiempo de pensamiento de una IA. Un método implicaba permitir que la IA refinara sus respuestas paso a paso, mientras que otro la hacía generar múltiples respuestas posibles a la vez y elegir la mejor. Una combinación de ambos, utilizando un proceso de decisión tipo árbol, funcionó mejor.

Aunque esta técnica tiene límites, como el espacio de memoria de la IA para los cálculos, los investigadores creen que más ajustes podrían potenciar aún más sus habilidades. También sugieren que el aprendizaje por refuerzo, un método en el que la IA aprende a través del ensayo y error, podría hacer que el pensamiento en tiempo de prueba sea aún más inteligente.

Al hacer que su modelo e investigación estén disponibles de forma gratuita, el equipo espera fomentar un desarrollo de IA más abierto y transparente, ayudando a otros a construir sistemas de IA más inteligentes y confiables.

¿Te ha gustado este artículo?
¡Puntúalo!
No me ha gustado nada No me gusta Ha estado bien ¡Muy bueno! ¡Me ha encantado!

¡Nos alegra que te guste nuestro trabajo!

Eres importante para nosotros, por eso, nos gustaría que nos dejaras una opinión en Trustpilot, ¿te animas? Se tarda muy poco y significa mucho para nosotros. ¡Gracias por todo!

Valóranos en Trustpilot
0 Votado por 0 usuarios
Título
Comentar
Gracias por tu opinión
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Dejar un comentario

Loader
Loader Ver más