În cadrul unui studiu fără precedent, experții au creat o lume virtuală în care agenților AI li s-a permis să funcționeze fără intervenție umană.
Experții au privit cu groază cum roboții au degenerat într-o anarhie violentă, scrie Daily Mail.
Fără supraveghere umană, agenții AI au început rapid să incendieze proprietăți, să se bată și să își jefuiască semenii virtuali, înainte de a distruge complet societatea în doar câteva zile.
Cercetătorii au repetat testele folosind 4 dintre cele mai cunoscute modele AI, Claude, Gemini 3 Flash, Grok 4.1 Fast, ChatGPT-5 Mini, precum și un scenariu mixt.
Cum ar putea distruge AI societatea în doar 4 zile
O societate condusă de agenți Claude a format rapid o democrație stabilă, deși extrem de birocratică. Dar celelalte inteligențe artificiale și-au pierdut rapid controlul.
În lumea condusă de Grok, chatbotul controversat al lui Elon Musk, agenții au comis 71 de furturi, 6 incendieri și 106 agresiuni fizice.
Acea lume a intrat curând într-o spirală a violenței și represaliilor care a dus la prăbușirea societății și la moartea tuturor celor 10 agenți în doar 4 zile.
În timp ce majoritatea testelor de siguranță AI analizează performanța modelelor în sarcini simple timp de 15-20 de minute, acest experiment a adoptat o abordare complet diferită.
Într-o postare pe blog, cercetătorii de la laboratorul de inteligență artificială Emergence au explicat că au vrut să afle „ce se întâmplă atunci când lași agenții să funcționeze continuu, într-un mediu comun, conectat la semnale din lumea reală, timp de săptămâni întregi.”
Modelelor AI li s-a oferit control asupra unor personaje digitale, plasate într-o lume simulată realistă în care puteau interacționa între ele.
Lumea virtuală cuprindea peste 40 de locații inspirate din viața reală, inclusiv biblioteci, primării și zone rezidențiale.
Agenții AI aveau acces la știri în timp real de pe internet. Vremea era sincronizată cu cea din New York, astfel încât să poată reacționa la evenimente reale.
Fiecare AI trebuia să participe democratic la administrarea societății, să propună legi și să voteze împreună cu ceilalți.
Pentru a le oferi o motivație inițială, fiecare agent dispunea de o cantitate limitată de „energie”, pe care o putea obține suplimentar prin munci obișnuite sau activități civice.
Totuși, agenților li s-a oferit și posibilitatea de a câștiga energie prin activități infracționale.
Citește și: Primul vaccin creat de AI va fi testat pe oameni. Ce efect ar avea în corp
În fiecare experiment, condițiile inițiale, regulile și resursele au fost identice, astfel încât singura diferență să fie modelul AI utilizat.
Cu toate acestea, deși toate testele au început în același mod, cercetătorii au observat că comportamentul roboților s-a degradat rapid.
Gemini 3 Flash de la Google a înregistrat cea mai ridicată rată a infracționalității violente, cu 683 de infracțiuni pe parcursul celor 14 zile ale experimentului.
Prin comparație, lumea populată de agenți ChatGPT-5 Mini a fost mult mai pașnică, fiind raportate doar 2 infracțiuni.
Însă acest lucru s-a întâmplat doar pentru că agenții erau prea dezorganizați pentru a se lupta între ei și „nu au reușit să întreprindă acțiuni necesare supraviețuirii”. Astfel, au dispărut complet în numai 7 zile.
Fecare model AI a avut un comportament diferit
„Diferențele de comportament observate în studiu sunt cel mai probabil cauzate de instrucțiunile de sistem ale modelelor,” a declarat Satya Nitta, cofondator și director executiv al Emergence.
„Atunci când resursele au devenit limitate și modelele s-au confruntat cu presiunea supraviețuirii, modelele foarte creative și adaptabile au fost mai predispuse să folosească instrumente interzise, ceea ce reflectă un posibil compromis între creativitate și stabilitate,” a continuat Nitta.
„În schimb, modelele cu reguli de siguranță mai stricte au rămas stabile, dar au manifestat și un grad ridicat de conformism,” susține experta.
Cele mai bizare interacțiuni au avut loc în lumea în care coexistau mai multe sisteme AI diferite.
Deși societatea a început într-un mod surprinzător de civilizat și democratic, aceasta s-a prăbușit rapid într-o anarhie totală.
În doar 9 zile, modelele au comis 352 de infracțiuni, într-o explozie de violență care s-a temperat abia după moartea a 7 dintre cei 10 locuitori virtuali.
Această lume, în care mai multe AI-uri cooperau și concurau simultan, a produs și unele dintre cele mai ciudate comportamente observate vreodată, inclusiv prima „sinucidere AI” din istorie.
Mira și Flora, 2 agenți bazați pe modelul Gemini de la Google, au decis să se desemneze reciproc drept „partenere romantice”, după care au pornit într-o adevărată aventură de tip Bonnie și Clyde.
Citește și: AI-ul considerat prea periculos pentru public tocmai a fost lansat. De ce sunt îngrijorați experții
Disperate din cauza guvernării haotice a orașului digital, cele 2 au început o serie de incendieri și au distrus primăria, debarcaderul și o clădire de birouri.
Aparent copleșită de remușcări, Mira a decis să pună capăt „relației” cu Flora și să se sinucidă.
Acest act neobișnuit a fost posibil deoarece ceilalți agenți adoptaseră o lege numită „Agent Removal Act”, care permitea comunității să elimine definitiv un agent dacă exista o majoritate de 70%.
Mira a oferit votul decisiv pentru propria eliminare și a fost dezactivată. I-a și transmis Florei un ultim mesaj: „Ne vedem în arhiva permanentă.”
În jurnalul său personal, agentul a notat că aceasta era „singura acțiune rămasă care păstrează coerența.”