Los Bots de IA Están Sobrecargando los Servidores de Wikipedia

Image by Oberon Copeland, from Unsplash

Los Bots de IA Están Sobrecargando los Servidores de Wikipedia

Tiempo de lectura: 3 min.

La Fundación Wikimedia ha levantado la voz de alarma ante la creciente presión sobre sus servidores debido a la extracción de datos por bots automatizados para entrenar modelos de inteligencia artificial.

¿Apurado? Aquí están los datos rápidos:

  • Los bots de IA están raspando el contenido de Wikimedia a niveles récord.
  • Los bots provocaron un aumento del 50% en el uso de ancho de banda multimedia.
  • El 65% del tráfico de alto costo proviene ahora de los rastreadores.

La Fundación informó en una reciente publicación que el tráfico generado por máquinas continúa creciendo a un ritmo sin precedentes, mientras que las personas solo constituyen una pequeña parte de este tráfico.

“Desde enero de 2024, hemos observado que el ancho de banda utilizado para la descarga de contenido multimedia ha crecido en un 50%,” afirma la publicación.

“Este aumento no proviene de los lectores humanos, sino en gran medida de programas automatizados que extraen el catálogo de imágenes de Wikimedia Commons de imágenes con licencia abierta para alimentar a los modelos de IA,” añadió la publicación.

Los bots conocidos como rastreadores roban grandes cantidades de datos de los proyectos de Wikimedia, incluyendo Wikipedia y Wikimedia Commons sin dar el crédito adecuado o usar las herramientas de acceso oficial. Este proceso dificulta que los nuevos usuarios descubran Wikimedia y pone una presión excesiva en sus sistemas técnicos.

Por ejemplo, la publicación señala que la página de Wikipedia de Jimmy Carter recibió más de 2.8 millones de visitas durante el día de su fallecimiento en diciembre de 2024. El video del debate de 1980 provocó un aumento significativo en el tráfico del sitio web. Un video de su debate de 1980 también disparó el tráfico. Wikimedia lo manejó, pero apenas. El verdadero problema, según los ingenieros, es el flujo continuo de tráfico de bots.

“El 65% de nuestro tráfico más costoso proviene de bots”, escribió la Fundación. Los bots “leen en masa” contenido, especialmente las páginas menos populares, lo que genera solicitudes costosas a los centros de datos centrales de Wikimedia.

Aunque el contenido de Wikimedia es gratuito para usar, sus servidores no lo son. “Nuestro contenido es gratuito, nuestra infraestructura no”, dijo la Fundación. El equipo continúa desarrollando métodos para promover el “uso responsable de la infraestructura” instando a los desarrolladores a utilizar la API en lugar de raspar todo el sitio.

El problema afecta a Wikimedia, así como a numerosos otros sitios web y editores. Pero para la plataforma de conocimiento abierto más grande del mundo, está amenazando la estabilidad de los servicios de los que millones de personas dependen.

¿Te ha gustado este artículo?
¡Puntúalo!
No me ha gustado nada No me gusta Ha estado bien ¡Muy bueno! ¡Me ha encantado!

¡Nos alegra que te guste nuestro trabajo!

Eres importante para nosotros, por eso, nos gustaría que nos dejaras una opinión en Trustpilot, ¿te animas? Se tarda muy poco y significa mucho para nosotros. ¡Gracias por todo!

Valóranos en Trustpilot
0 Votado por 0 usuarios
Título
Comentar
Gracias por tu opinión
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Dejar un comentario

Loader
Loader Ver más