
Dezvoltarea unei inteligențe artificiale bazate pe mecanisme similare creierului uman reprezintă un pas important în domeniul AI, mai ales după ce un model denumit hierarchical reasoning model (HRM) a obținut rezultate superioare față de cele mai avansate modele de limbaj mare (LLM). Cercetările recente din Singapore indică o posibilă schimbare în modul în care AI-ul abordează sarcinile complexe de raționament și rezolvare a problemelor.
Performanțe remarcabile în teste de raționament complex
Modelul HRM, dezvoltat de cercetătorii de la compania Sapient, s-a evidențiat în cadrul benchmark-ului ARC-AGI, considerat unul dintre cele mai dificile teste în evaluarea inteligenței artificiale generale (AGI). În testele ARC-AGI-1 și ARC-AGI-2, HRM a obținut scoruri de 40,3% și, respectiv, 5%, depășind semnificativ alte modele precum o3-mini-high de la OpenAI și Claude 3.7 de la Anthropic.
Învățând din analiza rezultatelor, cercetătorii subliniază că modelul folosește două module complementare: unul pentru planificare abstractă și altul pentru calcule rapide, imitând procesele cerebrale umane. De asemenea, tehnica de iterative refinement îi permite să ajusteze soluțiile în pași mici, sporind acuratețea problemelor dificil de rezolvat, precum Sudoku sau trasee optime în labirinturi.
Aspecte tehnice și tendințe în cercetarea AI
Comparativ cu modelele tradiționale de mari dimensiuni, HRM operează cu doar 27 de milioane de parametri, necesitând un volum redus de date pentru antrenament, estimat la doar 1.000 de exemple. Această abordare eficientizează procesul de învățare, reducând consumul de resurse, în contrast cu miliardele sau trilioanele de parametri ai LLM-urilor moderne.
Cu toate acestea, rezultatele obținute la benchmark-ul ARC-AGI sunt confirmate de cercetători independenți, care, totuși, remarcă faptul că arhitectura ierarhică a modelului nu a avut un impact major asupra performanței, fiind posibil ca anumite faze de rafinare mai atent documentate să fi fost decisive.
Perspectivă și implicații viitoare
Chiar dacă aceste rezultate indică o direcție promițătoare în dezvoltarea AI, ele ridică și întrebări cu privire la validitatea pe termen lung a metodologiei utilizate. HrM marchează încercarea de a construi sisteme mai eficiente, care să nu depindă exclusiv de cantitatea de date sau de dimensiunea parametrilor.
Pentru moment, tehnologia rămâne în faza de cercetare, iar rezultatele trebuie replicate și validate de comunitatea științifică. În continuare, monitorizarea evoluției acestor modele va fi esențială pentru înțelegerea impactului real asupra aplicațiilor practice și a dezvoltării inteligenței artificiale generale.
Fii primul care comentează