DeepMind, filiala de cercetare în inteligență artificială a companiei Google, a anunțat recent o arhitectură inovatoare în doi pași pentru roboți. Această abordare are scopul de a spori versatilitatea și autonomia roboților în mediile reale, combinând planificarea avansată cu controlul precis al mișcărilor. Sistemul utilizează două modele complementare, ce îmbunătățesc abilitatea roboților de a se adapta și de a îndeplini diverse sarcini, inclusiv în condiții dinamice și cu acces la informații externe actualizate.

În cadrul acestui sistem, primul model, Gemini Robotics-ER 1.5, acționează ca un „dirijor” inteligent, cu vedere multimodală (viziune și limbaj). Acesta analizează scena fizică, planifică pași multipli și poate solicita informații din internet pentru completarea cunoștințelor despre reguli locale sau condiții meteo. Astfel, robotul devine capabil să gestioneze sarcini complexe, care necesită adaptare la mediul specific.

Cel de-al doilea model, Gemini Robotics 1.5, este orientat spre executarea efectivă a planurilor. Acesta transformă indicatori în mișcări precise, controlând zone precum brațele, prinderea și deplasarea. O caracteristică remarcabilă este transferul comportamentelor învățate între platforme, reducând timpul necesar pentru adaptarea robotică la diverse medii de lucru.

Printre aplicațiile demonstrate recent se numără sortarea deșeurilor conform regulilor locale și pregătirea bagajelor, adaptând lista de obiecte la condițiile meteo. În primul cazul, robotul a consultat online regulile de eliminare a deșeurilor din San Francisco și a sortat obiectele în consecință. În cel de-al doilea, a verificat prognoza meteo pentru Londra și a ajustat lista de obiecte în consecință.

Această metodă în doi pași permite robotilor să devină mai flexibili și să răspundă eficient la schimbările de mediu sau reguli. Separarea planificării de control face ca adaptarea să fie mai rapidă și mai precisă, reducând costurile pentru industrie și transferul de competențe între platforme diferite.

Totuși, limitările includ dependența de sursele online și posibilitatea de erori sau informații inexacte. Medii fizice atipice, riscurile de siguranță și problemele de percepție în condiții variate rămân provocări. Integrarea în spații reale, precum depozite sau bucătării, necesită măsuri suplimentare pentru evitarea coliziunilor și siguranță.

În prezent, astfel de sisteme sunt testate în medii controlate, cu potențial de a evolua către aplicații mai diverse. În viitor, standardizarea componentelor și accentul pe robusteză și siguranță sunt esențiale pentru adoptarea pe scară largă.

Monitorizarea continuă a acestor tehnologii este importantă pentru înțelegerea impactului și limitărilor lor, precum și pentru asigurarea unei dezvoltări responsabile.