
Photo by Steve Johnson on Unsplash
La nueva empresa de IA, Deep Cogito, lanza sus primeros modelos de IA híbrida.
La nueva compañía estadounidense de IA, Deep Cogito, lanzó sus primeros modelos de lenguaje grande abiertos (LLMs) llamados Cogito v1 el martes. La startup asegura que sus modelos de código abierto e híbridos superan a modelos similares de IA abierta, incluyendo DeepSeek, Qwen y LLaMA de Meta.
¿Apurada? Aquí están los datos rápidos:
- Deep Cogito lanzó su primer LLM llamado Cogito v1 este martes.
- La nueva compañía estadounidense afirma que su modelo supera a los modelos de código abierto equivalentes, incluyendo Qwen, DeepSeek y LLaMA de Meta.
- Los modelos Cogito v1 funcionan en modo de razonamiento y modo estándar, y han sido optimizados para la llamada de funciones, la codificación y el uso agente.
Deep Cogito, con sede en San Francisco, presentó Cogito v1 a través de un anuncio oficial en su sitio web, incluyendo detalles de sus LLMs, su rendimiento y los próximos lanzamientos.
“Estamos lanzando los LLMs más potentes de tamaños 3B, 8B, 14B, 32B y 70B bajo licencia abierta”, afirma el documento. “Cada modelo supera a los mejores modelos abiertos disponibles del mismo tamaño, incluyendo contrapartes de LLaMA, DeepSeek y Qwen, en la mayoría de los benchmarks estándar. En particular, el modelo 70B también supera al recién lanzado modelo Llama 4 109B MoE”.
El nuevo modelo ha sido entrenado con la Destilación y Amplificación Iteradas (IDA), un marco que entrena a los modelos de IA para construir sistemas alineados para la superinteligencia general, e incluye características de “razonamiento”. Todos los modelos pueden funcionar en modo de razonamiento y modo estándar, una modalidad híbrida, y han sido optimizados para la llamada de funciones, la codificación y el uso agente.
Según la investigación y los resultados de la startup, Cogito v1 superó a la mayoría de los modelos equivalentes en modos directo y de razonamiento, considerando los parámetros de referencia populares. La empresa espera lanzar modelos más grandes en los próximos meses.
“Nuestra próxima publicación contará con puntos de control actualizados para cada tamaño de modelo (de 3B a 70B), con periodos de entrenamiento extendidos, así como modelos más grandes en las próximas semanas y meses”, escribió la empresa. “Todos los modelos serán de código abierto.”
Cogito v1 puede descargarse en Ollama o Hugging Face, o accederse a través de APIs en Together AI o Fireworks AI.
La vista previa de Cogito v1 ya está en vivo en Together AI ✨
Estos modelos abiertos de Deep Cogito amplían los límites del razonamiento y la alineación, con opciones de hasta 70B parámetros.
Disponible ahora a través de los puntos finales dedicados de Together. pic.twitter.com/hc0gYXU7x1
— Together AI (@togethercompute) 8 de abril de 2025
Según TechCrunch, Deep Cogito fue fundada en junio de 2024 por Drishan Arora y Dhruv Malhotra, ambos ex empleados de Google. La empresa cuenta con el respaldo de South Park Commons, y su principal objetivo es construir una superinteligencia general que pueda superar a los humanos.
El nuevo modelo de IA llega para mantenerse al ritmo de la intensidad y velocidad del mercado de IA y unirse a la tendencia de código abierto. El gigante del motor de búsqueda chino Baidu anunció un nuevo modelo de IA de código abierto en febrero, y DeepSeek compartió más detalles y una iniciativa de transparencia para su código hace tan solo unas pocas semanas.
Dejar un comentario
Cancelar