Photo by John Schnobrich on Unsplash

Alibaba lanza nuevo modelo de IA Qwen y afirma que supera a DeepSeek-V3

Tiempo de lectura: 2 min.

Actualizado por última vez: Jan 31, 2025

Escrito por Andrea Miliani Experto en noticias tecnológicas
Traducido por El equipo de localización y traducción Servicios de localización y traducción

El gigante chino Alibaba lanzó la última versión de su modelo insignia de IA, Qwen, este miércoles. La compañía asegura que puede rendir mejor que el popular DeepSeek-V3.

¿Apurado? ¡Aquí están los datos rápidos!

Alibaba lanzó su último modelo de razonamiento, Qwen 2.5-Max, este miércoles.
El gigante chino afirma que supera a modelos populares como DeepSeek-V3, GPT-4o y Llama-3.1-405B.
La compañía también lanzó Qwen2.5-VL esta semana, un modelo de IA capaz de procesar imágenes y actuar como un agente de IA utilizando computadoras y móviles para realizar tareas.

Según Reuters, Alibaba lanzó el nuevo Qwen 2.5-Max, como ha llamado al nuevo modelo de razonamiento, justo durante las vacaciones del Año Nuevo Lunar en China, para unirse a los masivos desarrollos de IA de los últimos días y añadir competencia doméstica.

El lunes, DeepSeek alcanzó el primer lugar en la App Store de Apple en los Estados Unidos, superando a ChatGPT, lo que preocupa a otras compañías en la industria de la IA y alarma a los inversores: las acciones de Nvidia cayeron un 17% en un solo día.

Ahora, Alibaba ha anunciado las últimas versiones de su modelo Qwen: lanzó 100 modelos de IA de código abierto para la suite Qwen en septiembre del año pasado, prometiendo mejores resultados que los modelos fronterizos populares.

“Qwen 2.5-Max supera (…) casi en todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B”, escribió la compañía en su cuenta oficial de WeChat.

La API del nuevo modelo de razonamiento Qwen 2.5-Max está disponible a través de la nube de Alibaba y los usuarios también pueden probar el modelo en su página de chat.

“Estamos desarrollando Qwen2.5-Max, un modelo MoE a gran escala que ha sido preentrenado con más de 20 billones de tokens y posteriormente reentrenado con metodologías cuidadosamente seleccionadas de Supervised Fine-Tuning (SFT) y Reinforcement Learning from Human Feedback (RLHF)”, escribió el Equipo Qwen en Github.

El gigante chino también lanzó el lunes Qwen2.5-VL, una serie de modelos de IA multimodales que también pueden procesar imágenes y acceder a móviles y computadoras para realizar tareas. OpenAI anunció una característica similar, Operator, que permite a ChatGPT realizar tareas de forma autónoma tomando el control del ordenador del usuario.

Según el equipo de Alibaba, todos los modelos Qwen superan en rendimiento a las versiones similares de OpenAI, Microsoft, Google, Meta y DeepSeek.

Alibaba lanza nuevo modelo de IA Qwen y afirma que supera a DeepSeek-V3

¡Nos alegra que te guste nuestro trabajo!

Dejar un comentario