La IA de DeepSeek Aprende a Pensar por Sí Misma

Image by Matheus Bertelli, from Pexels

La IA de DeepSeek Aprende a Pensar por Sí Misma

Tiempo de lectura: 2 min.

La startup china DeepSeek, en colaboración con la Universidad de Tsinghua, afirma haber desarrollado un método más inteligente para ayudar a los modelos de inteligencia artificial a pensar mejor y más rápido, sin necesidad de grandes computadoras o recursos costosos.

¿Con prisa? Aquí están los hechos rápidos:

  • DeepSeek creó una IA de auto-mejora utilizando la Afinación de Crítica Auto-Principiada (ACAP).
  • ACAP enseña a la IA a juzgar su propio trabajo utilizando reglas autogeneradas.
  • El método mejora el rendimiento sin necesidad de un gran poder de computación.

El avance proviene de una nueva técnica llamada Ajuste de Crítica Autoprincipiada (SPCT por sus siglas en inglés). SPCT es diferente de simplemente hacer modelos de IA más grandes para mejorar el rendimiento – SPCT no requiere mucha energía ni potencia de cálculo para enseñar a la IA a juzgar su propio trabajo utilizando un conjunto de reglas creadas por sí misma.

La forma en que funciona es a través de un “juez” incorporado que verifica que la respuesta de la IA tanto se adhiere a sus reglas de razonamiento interno, como parece adecuada para la interacción humana. Cuando la IA proporciona una respuesta sólida, recibe retroalimentación positiva, lo que ayuda a mejorar su capacidad para responder a preguntas similares en futuras instancias.

DeepSeek implementa este método como parte de su sistema DeepSeek-GRM, que significa Modelado de Recompensa Generativa. GRM funciona de manera diferente a los métodos tradicionales porque realiza controles paralelos para mejorar tanto la precisión como la consistencia.

“Proponemos el Ajuste de Crítica Autoprincipiada (ACAP) para fomentar comportamientos de generación de recompensas escalables”, escribieron las investigadoras en su artículo. “ACAP permite que [el modelo] adapte de manera adaptativa principios y críticas basadas en la consulta de entrada y las respuestas, lo que lleva a mejores recompensas de resultados”.

Con este sistema, DeepSeek afirma que su IA ahora puede superar a competidores como el Gemini de Google, el Llama de Meta y el GPT-4o de OpenAI, especialmente en tareas complejas como el razonamiento o la toma de decisiones, según lo señalado por Euronews.

Es importante destacar que DeepSeek dice que planea lanzar estas nuevas herramientas como software de código abierto, aunque aún no se ha compartido ninguna fecha de lanzamiento.

¿Te ha gustado este artículo?
¡Puntúalo!
No me ha gustado nada No me gusta Ha estado bien ¡Muy bueno! ¡Me ha encantado!

¡Nos alegra que te guste nuestro trabajo!

Eres importante para nosotros, por eso, nos gustaría que nos dejaras una opinión en Trustpilot, ¿te animas? Se tarda muy poco y significa mucho para nosotros. ¡Gracias por todo!

Valóranos en Trustpilot
0 Votado por 0 usuarios
Título
Comentar
Gracias por tu opinión
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Dejar un comentario

Loader
Loader Ver más