Photo by Sigmund on Unsplash

La Organización Sin Ánimo de Lucro Ai2 Lanza un Nuevo LLM Competitivo con la Llama de Meta

Tiempo de lectura: 3 min.

Publicado por primera vez el: Nov 28, 2024

Actualizado 2 veces desde su publicación

Escrito por Andrea Miliani Anteriormente experta en noticias tecnológicas
Traducido por El equipo de localización y traducción Servicios de localización y traducción

La organización sin fines de lucro de investigación, The Allen Institute for Artificial Intelligence (Ai2), lanzó OLMo 2, la segunda generación de su modelo de lenguaje abierto, con herramientas y capacidades altamente competitivas comparables a los modelos líderes en el mercado como Llama 3.1 de Meta.

¿Con prisa? ¡Aquí están los datos rápidos!

Ai2 lanzó ayer OLMo 2, un modelo de lenguaje avanzado y de código abierto
La organización lo describe como “el mejor modelo de lenguaje completamente abierto hasta la fecha”
OLMo 2 compite con otros modelos de código abierto como Llama 3.1 de Meta

Ai2, fundada por el cofundador de Microsoft, Paul Allen, en 2014, describió este modelo como “el mejor modelo de lenguaje completamente abierto hasta la fecha”.

“Presentamos OLMo 2, una nueva familia de modelos de 7B y 13B entrenados con hasta 5T de tokens”, escribió la organización en un anuncio en su sitio web. “Estos modelos están a la par o son mejores que los modelos completamente abiertos de tamaño equivalente, y son competitivos con modelos de peso abierto como Llama 3.1 en los estándares académicos en inglés”.

OLMo 2 es el resultado de una mejora a las versiones anteriores de modelos lanzados a lo largo del año: Ai2 anunció su primer modelo, OLMo, en febrero, centrándose en mejorar aspectos críticos como la estabilidad del entrenamiento, el preentrenamiento, el post-entrenamiento de última generación y el rendimiento a través de un marco de evaluación.

El nuevo modelo actualmente solo está disponible en inglés, y hay una demostración en línea disponible para el público para probar OLMo 2.

Según TechCrunch, OLMo 2 cumple con los criterios para ser considerado una IA de código abierto ya que sus datos y herramientas están públicamente disponibles y listos para ser probados.

Ai2 compartió datos que demuestran que este nuevo modelo puede superar a otros modelos populares con estructuras similares.

“Descubrimos que OLMo 2 7B y 13B son los mejores modelos completamente abiertos hasta la fecha, superando a menudo a modelos de peso abierto de tamaño equivalente”, afirma el documento compartido por la organización. “No solo observamos una mejora dramática en el rendimiento en todas las tareas en comparación con nuestro anterior modelo OLMo 0424, sino que, notablemente, OLMo 2 7B supera a LLama-3.1 8B y OLMo 2 13B supera a Qwen 2.5 7B a pesar de sus FLOPs de entrenamiento total inferiores.”

Alibaba lanzó los nuevos modelos Qwen 2.5, considerados por Ai2 para comparación, en septiembre.

La Organización Sin Ánimo de Lucro Ai2 Lanza un Nuevo LLM Competitivo con la Llama de Meta

¡Nos alegra que te guste nuestro trabajo!

Dejar un comentario