Las plataformas digitales atraviesan una crisis sin precedentes. Los ingresos publicitarios caen y la avalancha de contenido generado por inteligencia artificial amenaza la economía de la web. ¿Puede sobrevivir Internet sin creadores humanos?
Internet fue el gran escenario del conocimiento colectivo y la comunicación global, desde los primeros foros hasta los sitios de noticias. Pero en los últimos años, algo cambió: las redes se llenaron de ruido y los motores de búsqueda colapsaron bajo montañas de contenido artificial y repetitivo. Mientras los gigantes tecnológicos multiplican la producción automática con inteligencia artificial, periodistas, artistas y comunidades humanas pierden visibilidad y poder. A esta problemática se la llama “crisis del contenido”, una transformación silenciosa que amenaza con convertir a la red en una copia vacía de sí misma.
La crisis del contenido se debe a tres fenómenos: el colapso del modelo de las inteligencias artificiales, Google Zero y la inundación de contenido. Primero, es importante entender qué es la IA generativa: se trata de modelos conocidos como LLM (modelos de lenguaje de gran escala), que aprenden patrones del lenguaje a partir de grandes volúmenes de datos y luego los usan para predecir y generar texto. Se estima que los modelos actuales tienen una tasa de error que oscila entre el 20% y el 40%. A estos errores se los conoce como “delirio de la IA”, cuando el sistema inventa información sobre lo que se le pregunta.
En cuanto al colapso del modelo, se refiere a la disminución del rendimiento de la IA generativa (como ChatGPT o Gemini) cuando se enfrenta a textos generados por ella misma y no por humanos. Un grupo de investigadores de las universidades de Cambridge y Oxford analizó qué sucede cuando las herramientas de IA generativa consultan contenido producido por IA. Los resultados fueron alarmantes. El Dr. Ilia Shumailov, de la Universidad de Oxford y ex investigador sénior en Google DeepMind, y su equipo descubrieron que cuando el software de IA generativa se basa únicamente en contenido producido por IA, las respuestas comienzan a degradarse gradualmente.
El equipo confirmó el colapso del modelo al comenzar con una wiki preentrenada con IA que se actualizaba a partir de sus propios resultados. A medida que los datos erróneos contaminaban el conjunto original de datos de entrenamiento, la información se fue deteriorando progresivamente hasta volverse ininteligible. Por ejemplo, después del noveno ciclo de consultas, un extracto de un artículo sobre los campanarios de las iglesias inglesas del siglo XIV se transformó en un texto incoherente sobre los colores de los conejos y sus colas. En un modelo gráfico, se observó cómo se generan diferentes imágenes de razas de perros, pero a través de los ciclos, las razas menos conocidas quedaron excluidas, favoreciendo a las más populares como los golden retrievers. La IA crea su propio método de selección de facto, del tipo “usar o perder”, que elimina las razas menos populares de su base de datos. Tras suficientes ciclos de entrada únicamente con datos de IA, esta solo es capaz de generar resultados sin sentido.
Shumailov afirma que cada vez resulta más difícil para los desarrolladores humanos filtrar el contenido creado a gran escala por sistemas de IA, sin que se vislumbre una solución aparente. Para evitar este error, las empresas comenzaron a invertir en acuerdos de libre uso del contenido clásico, ya sean foros o páginas de noticias. Esto significa que los medios tradicionales y sus textos de calidad siguen teniendo un gran peso e importancia para las grandes empresas tecnológicas. Por ejemplo, Amazon paga hasta 25 millones de dólares al año al New York Times por licencias de contenido e IA. El acuerdo le otorga acceso a una amplia gama de contenido del medio, que Amazon puede utilizar para entrenar modelos de IA y ofrecer funciones como resúmenes o fragmentos de noticias. Según un informe de mayo de 2023, The New York Times ganó casi 100 millones de dólares en tres años gracias a un acuerdo con Google de Alphabet que permitió ofrecer contenido del Times en todas sus plataformas. Otras asociaciones similares están en marcha.
