„X și 0 rotit”: demonstrație a limitelor GPT-5, modelul considerat aproape uman

OpenAI a lansat GPT-5 ca fiind cel mai avansat model de limbaj, promițând răspunsuri mai naturale și apropiate de inteligența umană. Însă, un experiment recent arată că, dincolo de aceste promisiuni, modelul încă poate face greșeli alarmante la întrebări simple, evidențiind limitele actuale ale tehnologiei. În acest context, testul realizat de profesorul de economie Gary Smith oferă o perspectivă clară asupra performanței GPT-5 în situații triviale, dar de natură logică.

Experimentul a constat în confruntarea GPT-5 cu jocul „X și 0 rotit”, o variantă simplificată a tic-tac-toe, în care tabla este rotită cu 90 de grade. Deși pentru oameni această modificare nu schimbă regulile sau strategiile, modelul de limbaj a avut dificultăți în a oferi răspunsuri clare și coerente. În stadiu incipient, GPT-5 a explicat corect că rotirea nu influențează jocul, însă ulterior a introdus explicații complicate și redundant făcute pentru a justifica imposibilități percepute.

Când profesorul Smith a întrebat direct dacă rotația face jocul mai dificil pentru oameni, GPT-5 a continuat cu răspunsuri lungi și contradictorii, ceea ce a arătat o dificultate în gestionarea informațiilor simple. Diferența majoră a apărut atunci când modelul a încercat să „deseneze” tabla rotită, generând imagini confuze și greșit formulate, cu greșeli de ortografie și diagrame neclare, fără relevanță.

Acest episod ridică semne de întrebare asupra robusteței GPT-5 și indică faptul că modelele de limbaj, chiar și cele avansate, pot fi ambudiate în situații aparent simple. Expertul a remarcat că aceste erori nu se limitează la aspecte vizuale, ci relevă limitările în gestionarea logice, mai ales în contexte în care logica umană este evidentă. În plus, rezultatele contrastează cu promovarea OpenAI, care susține că GPT-5 trebuie perceput mai mult ca o conversație empatică, decât ca un arbitru al logicii.

Experimentul întărește ideea că modelele de limbaj nu gândesc așa cum o fac oamenii, ci prezintă tipare din datele de antrenament. Când logica simplă nu este frecvent întâlnită în seturile de date, apar erori sau răspunsuri exagerate. În același timp, experiența evidențiază diferența dintre promisiunile de marketing și realitatea implementării tehnologiei.

În final, rezultatele arată că GPT-5, deși performează bine în anumite domenii, are încă limitări în gestionarea problemelor simple și logice. Monitorizarea evoluțiilor și informarea continuă sunt esențiale pentru a înțelege pe deplin potențialul și limitele inteligenței artificiale.