Google DeepMind lanza herramienta de marca de agua de código abierto para ayudar a detectar textos generados por IA
¿Apurada? ¡Aquí están los datos rápidos!
- Google DeepMind lanzó SynthID-Text, una nueva herramienta gratuita de código abierto
- La tecnología SynthID ahora puede detectar texto, audio, video e imágenes generados por IA
- La investigación se publicó en Nature con más detalles técnicos
Google DeepMind lanzó este miércoles una herramienta de marca de agua de código abierto llamada SynthID-Text para ayudar a detectar texto generado por IA. La herramienta está disponible para empresas y desarrolladores de forma gratuita y funciona incrustando marcas de agua invisibles, indetectables para el ojo humano, en el texto durante la generación, al alterar las probabilidades de las palabras.
“Aquí describimos SynthID-Text, un esquema de marca de agua para texto listo para producción que conserva la calidad del texto y permite una alta precisión en la detección, con un mínimo retraso”, afirma el resumen de la investigación publicada en Nature. “Para permitir la marca de agua a gran escala, desarrollamos un algoritmo que integra la marca de agua con el muestreo especulativo, una técnica de eficiencia frecuentemente utilizada en sistemas de producción”.
Según MIT Technology Review, el laboratorio de investigación de IA del gigante tecnológico desarrolló la tecnología SynthID para crear múltiples herramientas de marca de agua de IA que ahora pueden reconocer texto, música, video e imágenes generados por IA. Google DeepMind compartió un video explicando cómo funciona la tecnología en diferentes tipos de medios.
Así es como SynthID marca con agua el contenido generado por IA en diferentes modalidades. ↓ pic.twitter.com/CVxgP3bnt2
— Google DeepMind (@GoogleDeepMind) 23 de octubre de 2024
SynthID está disponible a través del Google Responsible Generative AI Toolkit de la compañía, y los investigadores están trabajando junto con Hugging Face, una plataforma colaborativa para desarrolladores que aloja otros proyectos de código abierto como el tutorial de LeRobot para construir robots con inteligencia artificial en casa, para compartirlo en su sitio también.
“Ahora, otros desarrolladores de IA [generativa] podrán utilizar esta tecnología para ayudarles a detectar si las salidas de texto provienen de sus propios [modelos de lenguaje de gran tamaño], facilitando a más desarrolladores la construcción de IA de forma responsable”, dijo Pushmeet Kohli, el vicepresidente de investigación en Google DeepMind, a MIT Technology Review.
SynthID ha sido probado en los productos Gemini de Google, y millones de usuarios no pudieron diferenciar entre contenido con marca de agua y contenido sin marca de agua. Sin embargo, los investigadores reconocieron que tiene limitaciones cuando el texto ha sido editado o traducido, pero se mantienen optimistas y creen que la herramienta podría ayudar a combatir la desinformación y mejorar la seguridad de la IA.
Varias empresas de tecnología han estado anunciando estrategias de etiquetado de IA durante los últimos meses. Meta anunció en febrero un sistema para identificar contenido de IA en Instagram, Facebook y Threads, Google exigió a los usuarios que etiquetasen el contenido de IA en marzo, y Tiktok añadió etiquetas al contenido generado por IA en mayo.
Dejar un comentario
Cancelar