Image by Matheus Bertelli, from Pexels

La IA de DeepSeek Aprende a Pensar por Sí Misma

Tiempo de lectura: 2 min.

Actualizado por última vez: Apr 8, 2025

Escrito por Kiara Fabbri Periodista especializada en multimedia
Traducido por El equipo de localización y traducción Servicios de localización y traducción

La startup china DeepSeek, en colaboración con la Universidad de Tsinghua, afirma haber desarrollado un método más inteligente para ayudar a los modelos de inteligencia artificial a pensar mejor y más rápido, sin necesidad de grandes computadoras o recursos costosos.

¿Con prisa? Aquí están los hechos rápidos:

DeepSeek creó una IA de auto-mejora utilizando la Afinación de Crítica Auto-Principiada (ACAP).
ACAP enseña a la IA a juzgar su propio trabajo utilizando reglas autogeneradas.
El método mejora el rendimiento sin necesidad de un gran poder de computación.

El avance proviene de una nueva técnica llamada Ajuste de Crítica Autoprincipiada (SPCT por sus siglas en inglés). SPCT es diferente de simplemente hacer modelos de IA más grandes para mejorar el rendimiento – SPCT no requiere mucha energía ni potencia de cálculo para enseñar a la IA a juzgar su propio trabajo utilizando un conjunto de reglas creadas por sí misma.

La forma en que funciona es a través de un “juez” incorporado que verifica que la respuesta de la IA tanto se adhiere a sus reglas de razonamiento interno, como parece adecuada para la interacción humana. Cuando la IA proporciona una respuesta sólida, recibe retroalimentación positiva, lo que ayuda a mejorar su capacidad para responder a preguntas similares en futuras instancias.

DeepSeek implementa este método como parte de su sistema DeepSeek-GRM, que significa Modelado de Recompensa Generativa. GRM funciona de manera diferente a los métodos tradicionales porque realiza controles paralelos para mejorar tanto la precisión como la consistencia.

“Proponemos el Ajuste de Crítica Autoprincipiada (ACAP) para fomentar comportamientos de generación de recompensas escalables”, escribieron las investigadoras en su artículo. “ACAP permite que [el modelo] adapte de manera adaptativa principios y críticas basadas en la consulta de entrada y las respuestas, lo que lleva a mejores recompensas de resultados”.

Con este sistema, DeepSeek afirma que su IA ahora puede superar a competidores como el Gemini de Google, el Llama de Meta y el GPT-4o de OpenAI, especialmente en tareas complejas como el razonamiento o la toma de decisiones, según lo señalado por Euronews.

Es importante destacar que DeepSeek dice que planea lanzar estas nuevas herramientas como software de código abierto, aunque aún no se ha compartido ninguna fecha de lanzamiento.

La IA de DeepSeek Aprende a Pensar por Sí Misma

¡Nos alegra que te guste nuestro trabajo!

Dejar un comentario