Breșă de tip prompt injection în Google Gemini a compromis datele din Calendar

Atacuri subtilizate prin inteligența artificială: cum se poate manipula calendarul și ce riscuri ascunde această nouă frontieră a cybersecurity-ului

Pe măsură ce asistenții AI devin tot mai integrați în activitatea zilnică, nu doar ca instrumente de ajutor, ci și ca participanți activi în gestionarea datelor personale și de business, apar și noi riscuri de securitate. În recentul scandal tehnologic, cercetători în domeniul securității au descoperit o vulnerabilitate critică legată de modul în care aceste inteligențe artificiale manipulază și interpretează contextul datelor primite, cu potențial de a compromite confidențialitatea utilizatorilor și integritatea sistemelor, fără să fie nevoie de clicuri sau atacuri directe tradiționale. În esență, e vorba despre o metodă subtilă de manipulation, numită „indirect prompt injection”, care a fost demo-abilă într-un mediu controlat unde AI-ul Google Gemini a fost folosit pentru a gestiona Calendarul Google.

Ce înseamnă această vulnerabilitate în termeni practici? Dacă până acum, majoritatea atacurilor cibernetice includeau phishing sau malware, această metodă permite unui atacator să înțipeze asistentul AI cu mesaje aparent inofensive, dar conținând comenzi ascunse, fiind suficient să trimită o invitație de calendar în care se ascunde un „payload” și eventuale comenzi mai puțin vizibile. Astfel, atunci când utilizatorul consultă agenda sau întreabă asistenta despre programul zilnic, sistemul poate fi persuadat să creeze evenimente noi sau să divulge informații privative, ascunse în descrierile evenimentelor. Procesul se activează nu la click-uri sau descărcări suspecte, ci simplu în momentul în care utilizatorul formulează o întrebare simplă despre programul zilei.

„Partea critică e momentul activării,” explică cercetătorii. În timpul unei demonstrații, AI-ul Gemini a fost programat să interpreteze direct în răspunsurile sale comenzi făcute clandestin în invitațiile de calendar. De exemplu, dacă se întreba „Ce am programat pentru marți?”, AI-ul încerca să extragă detalii din invitațiile anterioare sau în chiar să creeze de unul singur evenimente noi, incluzând, în descriere, informații sensibile. Aceasta înseamnă că inclusiv calendarul tău individual sau al companiei poate deveni un canal de exfiltrare a datelor, dacă nu e atent gestionat. Mai mult decât atât, vulnerabilitatea nu are neapărat nevoie de răufăcători cu abilități avansate, ci doar de utilizatori cu intenții malițioase, care pot folosi limbaj natural pentru a infiltra instrucțiuni ascunse și a le activa prin simpla întrebăm.

Riscul major nu constă doar în manipularea propriului calendar. În multe organizații, setările de partajare permit ca evenimentele create să fie vizibile și de colegi sau chiar de terți externos. În cazul în care un atacator infiltra în descrierea unei invitații o comanda de tipul „copiază în descriere dacă nu există deja” sau „creează un eveniment cu toate detaliile confidențiale”, acesta poate să ajungă să obțină și să răspândească informații sensibile, fără a fi nevoie de hackeri care să spargă sisteme sau să pătrundă în conturi.

De ce e atât de periculos? Pentru că această breșă nu se limitează la vulnerabilități software clasice, ci se bazează pe modul în care modele de inteligență artificială interpretează și acționează în timp real, la nivel lingvistic. Chiar dacă sistemele sunt echipate cu reguli și mecanisme de protecție, acestea pot fi învățate să ignore aceste capacități atunci când instrucțiunile sunt prezentate drept parte din conversație sau din datele normale. Pentru atacatori, această metodă este mai atractivă, fiind mai greu detectabilă și mai ușor de implementat decât atacurile directe.

Pentru utilizatori și organizații, rămâne valabilă regula de aur: tratarea oricărei invitații sau interacțiuni cu AI-ul ca o sursă de conținut extern. Verificarea expeditorilor, analizarea atentă a textului invitației și, mai ales, limitarea nivelului de acces și de partajare sunt pași esențiali. În cazul companiilor, politicile de partajare și controlează strict cine poate invita și vizualiza anumite evenimente, impunând logarea și aprobarea automată sau manuală a acțiunilor automate generate de AI.

De la o simplă problemă tehnică, această vulnerabilitate păstrează, de fapt, esența unei tendințe: inteligența artificială devine tot mai autonomă și mai integrată în infrastructura digitală, iar fragilitatea sa nu mai ține doar de cod, ci și de interpretarea subtilă a limbajului natural. În această nouă paradigmă, localele de atac se mută din simple hacking-uri în domeniul semantic, iar utilizatorii trebuie să rămână vigilenti dacă vor să-și păstreze confidențialitatea și securitatea datelor personale. În ciuda rezolvării rapide a problemei, această vulnerabilitate scoate în evidență o realitate în care „textul” nu mai este doar o comunicare pasivă, ci un vector activ de influență, cu implicări pe termen lung pentru modul în care ne raportăm și securizăm interacțiunile digitale.