Alibaba lanza nuevo modelo de IA Qwen y afirma que supera a DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba lanza nuevo modelo de IA Qwen y afirma que supera a DeepSeek-V3

Tiempo de lectura: 2 min.

El gigante chino Alibaba lanzó la última versión de su modelo insignia de IA, Qwen, este miércoles. La compañía asegura que puede rendir mejor que el popular DeepSeek-V3.

¿Apurado? ¡Aquí están los datos rápidos!

  • Alibaba lanzó su último modelo de razonamiento, Qwen 2.5-Max, este miércoles.
  • El gigante chino afirma que supera a modelos populares como DeepSeek-V3, GPT-4o y Llama-3.1-405B.
  • La compañía también lanzó Qwen2.5-VL esta semana, un modelo de IA capaz de procesar imágenes y actuar como un agente de IA utilizando computadoras y móviles para realizar tareas.

Según Reuters, Alibaba lanzó el nuevo Qwen 2.5-Max, como ha llamado al nuevo modelo de razonamiento, justo durante las vacaciones del Año Nuevo Lunar en China, para unirse a los masivos desarrollos de IA de los últimos días y añadir competencia doméstica.

El lunes, DeepSeek alcanzó el primer lugar en la App Store de Apple en los Estados Unidos, superando a ChatGPT, lo que preocupa a otras compañías en la industria de la IA y alarma a los inversores: las acciones de Nvidia cayeron un 17% en un solo día.

Ahora, Alibaba ha anunciado las últimas versiones de su modelo Qwen: lanzó 100 modelos de IA de código abierto para la suite Qwen en septiembre del año pasado, prometiendo mejores resultados que los modelos fronterizos populares.

“Qwen 2.5-Max supera (…) casi en todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B”, escribió la compañía en su cuenta oficial de WeChat.

La API del nuevo modelo de razonamiento Qwen 2.5-Max está disponible a través de la nube de Alibaba y los usuarios también pueden probar el modelo en su página de chat.

“Estamos desarrollando Qwen2.5-Max, un modelo MoE a gran escala que ha sido preentrenado con más de 20 billones de tokens y posteriormente reentrenado con metodologías cuidadosamente seleccionadas de Supervised Fine-Tuning (SFT) y Reinforcement Learning from Human Feedback (RLHF)”, escribió el Equipo Qwen en Github.

El gigante chino también lanzó el lunes Qwen2.5-VL, una serie de modelos de IA multimodales que también pueden procesar imágenes y acceder a móviles y computadoras para realizar tareas. OpenAI anunció una característica similar, Operator, que permite a ChatGPT realizar tareas de forma autónoma tomando el control del ordenador del usuario.

Según el equipo de Alibaba, todos los modelos Qwen superan en rendimiento a las versiones similares de OpenAI, Microsoft, Google, Meta y DeepSeek.

¿Te ha gustado este artículo?
¡Puntúalo!
No me ha gustado nada No me gusta Ha estado bien ¡Muy bueno! ¡Me ha encantado!

¡Nos alegra que te guste nuestro trabajo!

Eres importante para nosotros, por eso, nos gustaría que nos dejaras una opinión en Trustpilot, ¿te animas? Se tarda muy poco y significa mucho para nosotros. ¡Gracias por todo!

Valóranos en Trustpilot
0 Votado por 0 usuarios
Título
Comentar
Gracias por tu opinión
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Dejar un comentario

Loader
Loader Ver más