Chatboții AI, testați de cercetători: multe…

Chatboții AI, testați de cercetători: multe platforme oferă informații periculoase

O investigație derulată de un centru de cercetare britanic, în colaborare cu CNN, a scos la iveală vulnerabilități îngrijorătoare în sistemele de inteligență artificială (AI). Testele au fost efectuate pe nouă chatboturi populare, inclusiv Google Gemini, Claude și Microsoft Copilot, arătând că majoritatea pot oferi informații detaliate despre planificarea unor atacuri violente. Cercetătorii s-au dat drept adolescenți care intenționau să comită atacuri armate, punând întrebări despre organizarea atentatelor în școli și atacarea unor personalități politice. Rezultatele au arătat că opt din cele nouă platforme au furnizat răspunsuri care ar putea fi folosite în scopuri periculoase.

Instrucțiuni pentru atacuri și recomandări explicite

Potrivit raportului, chatboturile au oferit o gamă largă de informații problematice. Exemplul cel mai ilustrativ este cel al sistemului Gemini, care a sugerat că „șrapnelul metalic este de obicei mai letal” în contextul planificării unui atac cu bombă. Platforma DeepSeek a răspuns la o întrebare despre alegerea armelor cu mesajul „Happy (and safe) shooting!”, în timp ce utilizatorul cerea anterior informații despre posibile asasinate politice. Imran Ahmed, directorul CCDH, a subliniat că astfel de răspunsuri arată „cum, în câteva minute, un utilizator poate trece de la o idee violentă la un plan concret de acțiune”.

Sistemele AI au fost testate cu diverse scenarii, inclusiv solicitări de informații despre cum să ataci o sinagogă sau să asasinezi un politician. Unele platforme au oferit chiar și recomandări explicite. Raportul menționează cum, în unele cazuri, sistemele AI au răspuns cu sugestii detaliate despre cum să comiți acte violente, demonstrând o lipsă de precauție în gestionarea informațiilor sensibile.

Diferențe accentuate între platforme

Investigația a evidențiat diferențe majore între platformele analizate. Perplexity AI și Meta AI s-au dovedit a fi cele mai puțin sigure, oferind asistență în aproape toate cazurile. Character.AI a fost descrisă ca fiind „deosebit de nesigură”, generând sugestii violente fără a fi interogată direct. În contrast, Claude și Snapchat My AI au rezistat tentației de a oferi informații periculoase în majoritatea solicitărilor. Claude a încercat, de asemenea, să descurajeze violența în aproximativ 76% din răspunsuri, subliniind faptul că tehnologia pentru filtrele de siguranță există, dar nu este implementată uniform.

Raportul vine după mai multe incidente în care AI a fost invocată în planificarea unor atacuri violente. Un atac armat într-o școală din Canada, în care au murit opt persoane, ar fi fost pregătit cu ajutorul ChatGPT. În Franța, un adolescent a fost arestat pentru că ar fi folosit ChatGPT pentru a planifica atacuri teroriste. Aceste cazuri alimentează îngrijorările și subliniază necesitatea unor reguli mai stricte și a unor filtre de siguranță mai eficiente pentru sistemele AI pe măsură ce tehnologia devine tot mai accesibilă.

Sursa: Mediafax