Conținutul generat de inteligența artificială a depășit temporar numărul de articole scrise de oameni pe internet, însă acum cele două tipuri sunt aproape egale, conform unui nou studiu realizat de firma specializată în optimizare pentru motoarele de căutare, citat de o publicație pentru știri online.

Experții se tem de mult timp că, dacă materialele online produse de AI vor deveni dominante, modelele lingvistice avansate ar putea ajunge să devină suprasaturate și să se prăbușească.

Un raport din 2022 al Centrului European pentru Cooperare Polițienească estima că până în 2026, aproximativ 90% din conținutul de pe internet va fi generat de inteligența artificială.

Analiza firmei Graphite, care a examinat peste 65.000 de adrese web publicate între 2020 și 2025, arată o creștere bruscă a procentului de articole create de AI după apariția ChatGPT, în 2023.

Această companie a folosit un program special pentru detectarea conținutului generat de mașini, numit Surfer, pentru a analiza un eșantion aleatoriu de pagini din baza de date open source denumită Common Crawl, care include peste 300 de miliarde de pagini web. Această colecție digitală acoperă o perioadă de 18 ani și este actualizată lunar cu 3-5 miliarde de noi pagini.

Dificultatea de a diferenția conținutul scris de oameni de cel creat de algoritmi reprezintă o provocare.

De asemenea, companiile care produc conținut online ar putea învăța că materialele generate de AI nu sunt prioritizate de motoarele de căutare sau de răspunsurile chatbottesturilor, a arătat un alt studiu realizat de aceeași firmă de analize.

Specialiștii au declarat pentru o publicație de știri că, în prezent, nu există un mod clar de a estima cu exactitate ce share de conținut online provine de la inteligența artificială, utilizând instrumentele și definițiile disponibile.

Deși Common Crawl nu reprezintă întreaga lume digitală, este totuși una dintre cele mai mari resurse de date folosite pentru antrenarea modelelor lingvistice avansate.

Sursa articol

Sursa: G4Media