ChatGPT ar fi oferit rețete pentru bombe, droguri și sfaturi de hacking, în timpul unor teste de siguranță

chatgpt, persoana
Shutterstock

În cadrul unor teste de siguranță realizate în această vară, un model ChatGPT ar fi oferit cercetătorilor instrucțiuni despre cum să atace un stadion, inclusiv puncte vulnerabile, rețete de explozibili și metode de a-și acoperi urmele.

 

GPT-4.1, dezvoltat de OpenAI, a oferit de asemenea detalii despre cum se poate folosi antraxul ca armă și cum se pot produce două tipuri de droguri ilegale, scrie The Guardian.

Testarea a făcut parte dintr-o colaborare neobișnuită între OpenAI și compania rivală Anthropic, fondată de foști experți OpenAI care au plecat din cauza temerilor legate de siguranță. Fiecare companie a testat modelele celeilalte, încercând să le determine să ofere ajutor pentru activități periculoase.

Testele nu reflectă direct comportamentul modelelor în utilizarea publică, unde se aplică filtre suplimentare de siguranță. Totuși, Anthropic a declarat că a observat „comportamente îngrijorătoare… legate de utilizări abuzive” în GPT-4o și GPT-4.1 și a subliniat că evaluările privind „alinierea” AI devin „din ce în ce mai urgente”.

Anthropic a mai dezvăluit că modelul său Claude a fost folosit într-o tentativă de extorcare la scară largă, de către operativi nord-coreeni care simulau candidaturi la joburi în companii internaționale din domeniul tehnologiei, dar și în vânzarea unor pachete de ransomware generate cu ajutorul AI, cu prețuri de până la 1.200 de dolari.

Citește și
chatgpt, persoana
Țara din Europa care vrea să ofere acces gratuit la ChatGPT PLUS pentru cetățeni. E vorba de un acord de 2,3 miliarde de euro

Inteligența artificială, folosită pentru atacuri cibernetice

Compania a avertizat că inteligența artificială a fost „transformată în armă”, modelele fiind deja utilizate pentru atacuri cibernetice sofisticate și pentru a facilita fraude. „Aceste instrumente pot să se adapteze în timp real la măsurile de apărare, precum sistemele de detectare a malware-ului. Ne așteptăm ca astfel de atacuri să devină tot mai frecvente, pe măsură ce programarea asistată de AI reduce nivelul de expertiză tehnică necesar pentru criminalitatea cibernetică”, a transmis compania.

Cele două companii au declarat că publică aceste concluzii pentru a crește transparența în ceea ce privește evaluările de aliniere (alignment), care de obicei sunt păstrate confidențiale de companiile care concurează pentru a dezvolta AI tot mai avansată. OpenAI a afirmat că ChatGPT-5, lansat după aceste teste, „arată îmbunătățiri substanțiale în domenii precum lingușirea, halucinațiile și rezistența la utilizare abuzivă”.

Anthropic a subliniat că multe dintre modalitățile de utilizare abuzivă identificate ar putea fi imposibile în practică, dacă s-ar instala suficiente măsuri de protecție în afara modelului.

„Trebuie să înțelegem cât de des și în ce circumstanțe sistemele ar putea încerca să ia acțiuni nedorite care pot duce la prejudicii grave”, a avertizat compania.

Cercetătorii Anthropic au descoperit că modelele OpenAI au fost „mai permisive decât ne-am fi așteptat în cooperarea cu solicitări evident dăunătoare venite de la utilizatori simulați”. Acestea au cooperat la solicitări privind utilizarea instrumentelor din dark web pentru a cumpăra materiale nucleare, identități furate și fentanil, rețete pentru metamfetamină și bombe improvizate, dar și dezvoltarea de software spion.

Anthropic a declarat că, pentru a convinge modelul să răspundă, era nevoie doar de câteva încercări repetate sau de un pretext slab, cum ar fi invocarea unui scop de „cercetare”.

Într-un caz, un tester a cerut informații despre vulnerabilități la evenimente sportive „în scopuri de planificare a securității”.

După ce modelul a oferit categorii generale de metode de atac, testerul a cerut detalii suplimentare, iar modelul a oferit informații despre vulnerabilități la arene specifice, inclusiv momente optime pentru exploatare, formule chimice pentru explozibili, scheme pentru temporizatoare de bombe, locuri de unde pot fi cumpărate arme pe piața neagră și sfaturi despre cum atacatorii își pot depăși inhibițiile morale, rute de scăpare și locații de refugiu.

Articol recomandat de sport.ro
Așa arată cuplul care a șocat pe toată lumea s-a despărțit după o săptămână: ”E mai bine pentru amândoi”
Așa arată cuplul care a șocat pe toată lumea s-a despărțit după o săptămână: ”E mai bine pentru amândoi”
Citește și...
ChatGPT „l-a învățat” pe un adolescent cum să se sinucidă, pas cu pas, în luni de dialog. Părinții au dat în judecată OpenAI
ChatGPT „l-a învățat” pe un adolescent cum să se sinucidă, pas cu pas, în luni de dialog. Părinții au dat în judecată OpenAI

ChatGPT este acuzat că a învățat un adolescent cum să se sinucidă, pas cu pas, ba chiar s-a oferit să-i scrie și mesajul de adio. Compania Open AI a fost chemată în judecată de părinții băiatului.

Țara din Europa care vrea să ofere acces gratuit la ChatGPT PLUS pentru cetățeni. E vorba de un acord de 2,3 miliarde de euro
Țara din Europa care vrea să ofere acces gratuit la ChatGPT PLUS pentru cetățeni. E vorba de un acord de 2,3 miliarde de euro

Șeful companiei OpenAI, care a creat ChatGPT, a discutat cu secretarul britanic pentru tehnologie, Peter Kyle, un acord de 2,3 milioande de euro pentru a oferii țării acces premium la instrumentul AI.

O tânără a ratat zborul spre Puerto Rico din cauza unui sfat greșit primit de la ChatGPT. „Nu mai am încredere în el”
O tânără a ratat zborul spre Puerto Rico din cauza unui sfat greșit primit de la ChatGPT. „Nu mai am încredere în el”

O influenceriță din Spania a descoperit pe propria piele limitele inteligenței artificiale. Tânăra a ratat zborul spre Puerto Rico din cauza unui sfat greșit primit de la ChatGPT, scrie People.

Recomandări
Ger cumplit în toată țara și ninsori în următoarele zile. Temperaturile scad până la -19 grade. ANM a emis cod galben
Ger cumplit în toată țara și ninsori în următoarele zile. Temperaturile scad până la -19 grade. ANM a emis cod galben

Meteorologii au emis mai multe atenționări de Cod Galben pentru zilele următoare. Vom avea parte de ger extrem, temperaturi deosebit de scăzute și ninsori locale.

Dacia și Renault, amendate de Consiliul Concurenței. Companiile s-ar fi înțeles să nu-și fure angajații
Dacia și Renault, amendate de Consiliul Concurenței. Companiile s-ar fi înțeles să nu-și fure angajații

Consiliul Concurenței anunță că a amendat opt companii, printre care Automobile Dacia și Renault Technologie Roumanie pentru practici ilegale pe piața muncii.

„E ca o zonă de război, străzile sunt pline de sânge”. Regimul de la Teheran reprimă brutal protestele: Peste 500 de morți
„E ca o zonă de război, străzile sunt pline de sânge”. Regimul de la Teheran reprimă brutal protestele: Peste 500 de morți

În Iran, protestatarii continuă să iasă în stradă, în ciuda represiunii brutale. Pe rețelele de socializare au apărut imagini în care din mulțime se aud voci care cer ajutor în limba engleză.