Une étude du cabinet de référencement Graphite trouvé que 52 % de tous les nouveaux contenus écrits sur Internet sont désormais générés par l’IA. La recherche a suivi une augmentation rapide de ces articles après la sortie de ChatGPT en novembre 2022. L’analyse a examiné un échantillon de 65 000 articles en anglais publiés entre janvier 2020 et mai 2025. Pour effectuer la classification, l’étude a utilisé un outil de détection d’IA nommé Surfer, qui signalait les articles comme créés par l’IA s’ils contenaient 50 % ou plus de texte généré automatiquement. Avant le lancement de ChatGPT, les éléments générés par l’IA représentaient environ 10 % du nouveau contenu. Ce chiffre a grimpé à plus de 40 % d’ici 2024, démontrant une adoption rapide de la technologie pour la production de contenu. La proportion d’articles rédigés par l’IA a brièvement dépassé celle des articles rédigés par des humains fin 2024 avant de se stabiliser. En mai 2025, la répartition s’était stabilisée autour d’un ratio 50-50, l’IA représentant la légère majorité du nouveau matériel. Malgré ce volume élevé, les moteurs de recherche comme Google filtreraient les « slops » d’IA de mauvaise qualité des meilleurs résultats de recherche. Par conséquent, seulement 14 % environ du contenu le mieux classé de Google est identifié comme étant généré par l’IA. Cette augmentation est principalement due à l’application rentable de grands modèles linguistiques, notamment ChatGPT, Claude et Gemini, pour l’optimisation des moteurs de recherche (SEO) et pour augmenter le trafic en ligne. La qualité du contenu de l’IA s’est également améliorée, atteignant dans certains cas ou dépassant le texte écrit par l’homme et le rendant plus difficile à distinguer. Les experts suggèrent que cette tendance représente une symbiose entre la création de contenu humain et IA plutôt qu’un remplacement complet des écrivains humains. Des inquiétudes ont été soulevées concernant d’éventuelles boucles de rétroaction. Ce problème implique la formation des modèles d’IA sur des données comprenant du contenu de mauvaise qualité ou généré par l’IA, ce qui pourrait dégrader la qualité globale du contenu Internet au fil du temps.