¿Internet muerto? Una tercera parte de los sitios web nuevos son generados por IA, dice Stanford

En resumen

  • Para mediados de 2025, el 35% de los sitios web publicados recientemente eran generados o asistidos por IA, en comparación con cero antes del lanzamiento de ChatGPT en noviembre de 2022.
  • Los efectos confirmados son contracción semántica y positividad artificial, no desinformación o homogeneidad estilística, a pesar de lo que la mayoría de la gente cree.
  • Con una prevalencia de IA del 35%, el riesgo de colapso del modelo pasa de ser una preocupación teórica a una realidad empírica para la próxima generación de modelos fundamentales.

Un nuevo estudio tiene una cifra de cuánto de internet ahora es generado por IA: 35%. Esa es la proporción de sitios web publicados recientemente clasificados como generados o asistidos por IA para mediados de 2025, según investigaciones de la Universidad de Stanford, Imperial College London y el Archivo de Internet. La cifra era esencialmente cero antes del lanzamiento de ChatGPT en noviembre de 2022. “Encuentro bastante asombroso la velocidad con la que la IA está tomando el control de la web,” dijo Jonáš Doležal, investigador en Imperial College London y coautor del artículo, a 404 Media. “Después de décadas en las que los humanos la moldearon, una parte significativa de internet se ha definido por la IA en solo tres años.” El estudio, titulado “El impacto del texto generado por IA en internet,” se basó en 33 meses de instantáneas de sitios web del Wayback Machine del Archivo de Internet y utilizó un detector de texto por IA llamado Pangram v3 para clasificar cada página.

 Los daños confirmados: vibras, no hechos Los investigadores probaron seis hipótesis sobre lo que el contenido de IA hace en la web. Solo dos resistieron el escrutinio de los datos. La primera: Nos estamos convirtiendo en una horda de NPCs tontos actuando de la misma manera… O más científicamente, la web se está volviendo menos diversa semánticamente.

Los sitios generados por IA mostraron puntuaciones de similitud semántica pareada un 33% más altas que los escritos por humanos. Las mismas ideas siguen expresándose de casi las mismas maneras.

El artículo sugiere que la ventana de Overton en línea puede estar estrechándose, no a través de censura o campañas coordinadas, sino porque los modelos de lenguaje optimizan para salidas cercanas a su distribución de entrenamiento. La segunda: La web se está volviendo agresivamente optimista. El contenido de IA mostró puntuaciones de sentimiento positivo más del 107% más altas que el contenido humano. Los investigadores vinculan esto a las bien documentadas tendencias aduladoras de los LLMs—entrenados con señales de aprobación humana, producen textos que parecen sanitizados, sin fricciones y constantemente optimistas. Una internet inundada de contenido alegre y homogeneizado puede marginar la disensión humana a gran escala sin que nadie active una palanca.

A pesar de la creencia pública generalizada, el estudio no encontró evidencia estadísticamente significativa de que el contenido de IA esté haciendo que internet sea menos preciso en los hechos. Los investigadores no encontraron una correlación significativa entre la prevalencia de IA y la tasa de errores fácticos.

La hipótesis de monocultivo estilístico—que la IA aplana las voces individuales en un registro uniforme y genérico—fue la creencia que los encuestados sostenían con más fuerza (83% estuvo de acuerdo). Los datos no la confirmaron. Un análisis a nivel de carácter no encontró un aumento estadísticamente significativo en la homogeneidad estilística vinculada a la prevalencia de IA. El problema del colapso del modelo acaba de volverse real Las apuestas más amplias van más allá de la calidad del discurso. Con una prevalencia de IA del 35%, el riesgo teórico de colapso del modelo—donde los modelos futuros se degraden después de entrenar con datos generados por IA—pasa de ser una preocupación académica a una realidad empírica. Los futuros modelos fundamentales entrenados con rastreos web contemporáneos inevitablemente ingerirán datos que son sustancialmente generados por IA y mediblemente menos diversos semánticamente. El equipo ahora trabaja con el Archivo de Internet para convertir el estudio en una herramienta de monitoreo continuo y en vivo, que rastree la participación de la IA en la web en tiempo real en lugar de una instantánea puntual. Una encuesta en EE. UU. realizada junto con el estudio encontró que la mayoría de los estadounidenses ya creen en las seis hipótesis negativas, incluidas las que los datos no respaldan. Las personas que usan IA con poca frecuencia tenían un 12% más de probabilidades de creer en los daños que los usuarios frecuentes. Los creyentes en la Teoría del Internet Muerto, aquí tienen los datos: La internet no está muerta, pero el 35% de lo nuevo probablemente sea contenido zombi de alguna manera.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado