ChatGPT, sub lupă: Inteligența artificială,…

ChatGPT, sub lupă: Inteligența artificială, între performanțe promițătoare și limite îngrijorătoare

Un studiu recent, citat de ScienceDaily, aruncă o umbră de îndoială asupra capacităților modelului lingvistic ChatGPT de a evalua ipoteze științifice. Deși rezultatele inițiale pot părea încurajatoare, analiza detaliată dezvăluie deficiențe semnificative, mai ales în ceea ce privește consistența și capacitatea de a identifica informații false.

Acuratețe fluctuantă și dificultăți în a identifica erorile

Cercetătorii au testat ChatGPT pe sute de ipoteze, adresând aceleași întrebări de mai multe ori. În 2024, modelul a oferit răspunsuri corecte în aproximativ 76,5% din cazuri. Într-o a doua fază, în 2025, acuratețea a crescut la 80%. Totuși, după ajustarea rezultatelor pentru a elimina influența ghicitului aleatoriu, performanța reală scade considerabil. Ajunge la un nivel de aproximativ 60% peste șansă, indicând o fiabilitate moderată, nicidecum una solidă.

Problema devine și mai evidentă atunci când se analizează capacitatea de a identifica afirmațiile false. Doar 16,4% dintre acestea au fost recunoscute ca fiind incorecte. Cu alte cuvinte, sistemul are o tendință de a valida informații greșite, ceea ce poate fi riscant în contexte reale. Această deficiență ridică semne serioase de întrebare cu privire la utilizarea ChatGPT în domenii unde precizia este esențială.

Răspunsuri inconsistente și potențialul de confuzie

Un alt aspect îngrijorător evidențiat de studiu este lipsa de consecvență a răspunsurilor. Chiar și atunci când cercetătorii au folosit exact aceeași întrebare de mai multe ori, răspunsurile oferite de ChatGPT nu au fost întotdeauna identice. În aproximativ 73% dintre cazuri, răspunsurile au fost consecvente. În restul situațiilor, modelul a oferit variante diferite pentru aceeași întrebare, uneori alternând între „adevărat” și „fals” fără o justificare clară.

Autorii studiului atrag atenția că problema nu este doar lipsa de acuratețe, ci și această inconsistență. În scenarii reale, unde deciziile pot depinde de un răspuns clar, astfel de variații pot crea confuzie sau pot duce la interpretări greșite. Acesta este un aspect crucial, mai ales în domenii precum știința sau afacerile, unde nuanțele contează.

Concluzia generală a cercetătorilor este una echilibrată: inteligența artificială rămâne un instrument util, dar nu trebuie tratată ca o sursă infailibilă de adevăr. Experții recomandă utilizatorilor, inclusiv companiilor, să abordeze cu prudență rezultatele generate de AI, să le verifice din surse independente și să investească în înțelegerea limitelor acestor tehnologii.

În contextul acestui studiu, companii precum OpenAI, dezvoltatorii ChatGPT, continuă să lucreze la îmbunătățirea modelului, cu accent pe creșterea consistenței și capacității de a identifica informații false.

Sursa: Playtech.ro