Cum vor zdruncina hackerii AI securitatea cibernetică

Sursa: Pixabay

Tehnologia ar putea în cele din urmă să-i favorizeze pe apărători, dar așteptați-vă la o cursă dificilă, avertizează The Economist.

<<Firmele de tehnologie fac vâlvă de obicei în jurul produselor pe care intenționează să le lanseze. Anthropic, un laborator american de inteligență artificială, a reușit să creeze entuziasm – și multă îngrijorare – în jurul a ceva ce nu intenționează să lanseze. Pe 7 aprilie, firma a anunțat că un nou model de inteligență artificială pe care l-a dezvoltat, numit Mythos, nu va fi lansat pentru publicul larg. În schimb, în ​​cadrul unei inițiative numite Project Glasswing, ai cărei 12 membri fondatori includ Apple, Google și Nvidia, accesul va fi strict controlat.

Problema nu este că Mythos este plin de erori sau nesigur. Se presupune că funcționează atât de bine, încât lansarea sa ar pune în pericol infrastructura digitală a lumii. Potrivit Anthropic, modelul a depășit „toți oamenii, cu excepția celor mai pricepuți”, când vine vorba de găsirea și exploatarea breșelor de securitate în orice, de la sistemele de operare populare, până la software-ul criptografic care securizează comerțul electronic și rețelele financiare. Și poate găsi aceste vulnerabilități cu doar un minim ajutor uman.Ca să nu rămână mai prejos, OpenAI, unul dintre concurenții Anthropic, a anunțat câteva zile mai târziu o versiune închisă a propriului model adaptat pentru hacking, numită GPT 5.4 Cyber.

O lume a „vibe hacking-ului”, în care amatorii pot folosi modele de inteligență artificială pentru a găsi defecte în software – și poate chiar a scrie „exploit-urile” necesare pentru a le bloca, a le cere răscumpărare sau chiar a prelua controlul asupra lor de la distanță – sună terifiant. La scurt timp după anunțul Anthropic, Scott Bessent, secretarul Trezoreriei americane, a găzduit o întâlnire a directorilor de bănci pentru a discuta ce ar putea însemna hacking-ul bazat pe inteligență artificială pentru afacerile lor. Autoritățile de reglementare financiară din Marea Britanie au organizat o întâlnire similară câteva zile mai târziu. Dar cercetătorii în domeniul securității par, într-un mod rezervat, optimiști. „Pe termen mediu, cred că va fi o harababură”, spune Bruce Schneier, un expert american în securitate informatică. „Dar, pe termen lung, cred că va fi de fapt benefic pentru protectori.”

Întrucât Anthropic a publicat doar informații limitate despre Mythos, este greu de evaluat gradul în care noul model este cu adevărat revoluționar, mai degrabă decât evoluționar (ceea ce ar putea fi numită politicos o „dezbatere aprinsă” face ravagii online). Testele efectuate de Institutul de Securitate AI, o agenție guvernamentală britanică, au descoperit că Mythos era la egalitate cu alte modele în teste de securitate cibernetică relativ simple, dar vizibil în avantaj într-unul mai avansat, care necesită ca un model să parcurgă zeci de pași înainte de a prelua cu succes controlul asupra unui computer țintă (vezi graficul).

Principalul lucru pe care cercetătorii Anthropic l-au investigat a fost capacitatea Mythos de a descoperi erori pe care hackerii le-ar putea folosi pentru a ataca sau a obține controlul asupra altor computere. Aceștia au căutat în mod specific erori care nu mai fuseseră găsite până acum (cunoscute sub numele de „zero-days” în jargon). Găsirea acestora ar dovedi că modelul făcea o treabă nouă și nu doar repeta mecanic erori cunoscute pe care le întâlnise în datele sale de antrenament.

„Zero-day-urile pândesc peste tot”, spune Jeff Williams, cofondator al Contrast Security, o firmă de software, și al Open Worldwide Application Security Project Foundation, o organizație non-profit dedicată îmbunătățirii securității software. Deși se spune că Mythos a găsit „mii” de defecte de împortanță ridicată sau critică, Anthropic le păstrează secrete pe majoritatea până când acestea pot fi remediate. Însă firma a dezvăluit detalii despre unele dintre ele, inclusiv una în FreeBSD, un sistem de operare utilizat pe scară largă, o alta în FFmpeg – o bibliotecă de coduri video și audio, și o a treia – care rămâne neremediată – în software-ul vital pentru cloud computing.

Multe dintre erorile raportate de Anthropic sunt, dacă nu simple, cel puțin ușor de înțeles. Sunt genul de lucruri pe care un om le-ar fi putut găsi în mod plauzibil. Totodată, se pare că sunt genul de lucruri pe care și alte modele de inteligență artificială le-ar fi putut găsi. Într-o postare pe blog publicată la scurt timp după anunțul Anthropic, Stanislav Fort, fondatorul companiei de securitate cibernetică axată pe inteligență artificială, a descris utilizarea mai multor modele mai mici și mai vechi pentru a găsi aceeași eroare în FreeBSD. Citând experiența propriei firme în căutarea de erori bazată pe inteligență artificială, Dr. Fort consideră că frontiera securității cibernetice bazată pe inteligență artificială este „neregulată”, niciun model neavând un avantaj clar.

Toată lumea este de acord că în stadiul actual tehnica avansează rapid. Până de curând, căutarea de erori bazată pe inteligență artificială era predispusă la generarea de rezultate fals pozitive sau rezultate banale. „O schimbare pe care am observat-o în ultimele două luni este că multe dintre aceste rapoarte de erori generate de inteligență artificială sunt de o calitate din ce în ce mai de bună”, spune dl Schneier. O actualizare din ianuarie a OpenSSL, care ajută la asigurarea conexiunilor securizate între site-uri web, a remediat o duzină de defecte de securitate găsite de modelele de inteligență artificială utilizate de firma Dr. Fort. În martie, Anthropic a anunțat că o versiune mai veche, pre-Mythos, a programului Claude a găsit aproape o cincime din toate erorile grave remediate în Firefox, un browser web, în ​​2025.

Pe măsură ce puterea tot mai mare a modelelor de inteligență artificială facilitează găsirea erorilor, spune dl Schneier, întrebarea devine dacă atacatorii le pot exploata mai repede decât le pot remedia apărătorii. Aici intervine Proiectul Glasswing. Anthropic spune că extinde Glasswing la alte 40 de organizații de infrastructură digitală, astfel încât acestea să poată utiliza Mythos pentru a consolida software-ul de care depinde internetul. Anthropic speră că oferindu-le acces acum, înainte ca modele la fel de puternice să devină disponibile pe scară largă, le va lăsa timp să găsească și să remedieze cât mai multe erori.

Toți cercetătorii cu care a vorbit The Economist au considerat că, pe termen lung, hacking-ul bazat pe inteligență artificială i-ar ajuta probabil pe apărători mai mult decât pe atacatori, permițând companiilor să își verifice mai amănunțit software-ul înainte de a fi publicat. Dar există o mulțime de motive de îngrijorare pe termen scurt. În primul rând, verificarea prin inteligență artificială nu este ieftină: Anthropic spune că una dintre erorile descoperite a costat laboratorul de inteligență artificială aproape 20.000 de dolari în token-uri. Pentru un software precum Linux, o familie de sisteme de operare utilizate pe scară largă, care sunt cel puțin parțial întreținute de voluntari, acesta ar fi un preț piperat. Și o mare parte din codul existent în lume – care rulează pe routere de acasă, gadgeturi inteligente precum televizoare sau frigidere și utilaje industriale – nu este întreținut de nimeni. În astfel de cazuri, atacatorii ar putea avea parte de o zi de glorie.>>

Momentul „Mythos”. America se trezește în fața puterii periculoase a inteligenței artificiale