
Photo by John Schnobrich on Unsplash
Alibaba lanza nuevo modelo de IA Qwen y afirma que supera a DeepSeek-V3
El gigante chino Alibaba lanzó la última versión de su modelo insignia de IA, Qwen, este miércoles. La compañía asegura que puede rendir mejor que el popular DeepSeek-V3.
¿Apurado? ¡Aquí están los datos rápidos!
- Alibaba lanzó su último modelo de razonamiento, Qwen 2.5-Max, este miércoles.
- El gigante chino afirma que supera a modelos populares como DeepSeek-V3, GPT-4o y Llama-3.1-405B.
- La compañía también lanzó Qwen2.5-VL esta semana, un modelo de IA capaz de procesar imágenes y actuar como un agente de IA utilizando computadoras y móviles para realizar tareas.
Según Reuters, Alibaba lanzó el nuevo Qwen 2.5-Max, como ha llamado al nuevo modelo de razonamiento, justo durante las vacaciones del Año Nuevo Lunar en China, para unirse a los masivos desarrollos de IA de los últimos días y añadir competencia doméstica.
El lunes, DeepSeek alcanzó el primer lugar en la App Store de Apple en los Estados Unidos, superando a ChatGPT, lo que preocupa a otras compañías en la industria de la IA y alarma a los inversores: las acciones de Nvidia cayeron un 17% en un solo día.
Ahora, Alibaba ha anunciado las últimas versiones de su modelo Qwen: lanzó 100 modelos de IA de código abierto para la suite Qwen en septiembre del año pasado, prometiendo mejores resultados que los modelos fronterizos populares.
“Qwen 2.5-Max supera (…) casi en todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B”, escribió la compañía en su cuenta oficial de WeChat.
La API del nuevo modelo de razonamiento Qwen 2.5-Max está disponible a través de la nube de Alibaba y los usuarios también pueden probar el modelo en su página de chat.
“Estamos desarrollando Qwen2.5-Max, un modelo MoE a gran escala que ha sido preentrenado con más de 20 billones de tokens y posteriormente reentrenado con metodologías cuidadosamente seleccionadas de Supervised Fine-Tuning (SFT) y Reinforcement Learning from Human Feedback (RLHF)”, escribió el Equipo Qwen en Github.
El gigante chino también lanzó el lunes Qwen2.5-VL, una serie de modelos de IA multimodales que también pueden procesar imágenes y acceder a móviles y computadoras para realizar tareas. OpenAI anunció una característica similar, Operator, que permite a ChatGPT realizar tareas de forma autónoma tomando el control del ordenador del usuario.
Según el equipo de Alibaba, todos los modelos Qwen superan en rendimiento a las versiones similares de OpenAI, Microsoft, Google, Meta y DeepSeek.
Dejar un comentario
Cancelar