Disputa dintre guvernul Americii și Anthropic intensifică o tendință alarmantă, notează The Economist.
<< Deși a încercat să pară hotărât, Donald Trump a transmis din greșeală ceva din ambivalența lumii față de dezvoltarea rapidă a inteligenței artificiale. Pe 27 februarie, președintele Americii i-a atacat dur pe „nebunii de stânga” de la Anthropic, un laborator american de inteligență artificială care lucrează cu Departamentuil Apărării al Statelor Unite, printre alte agenții guvernamentale. „Le ordon tuturor agențiilor federale ale Guvernului Statelor Unite să înceteze imediat orice utilizare a tehnologiei Anthropic. Nu avem nevoie de ea, nu o vrem și nu vom mai face afaceri cu ei niciodată!”, a tunat el pe rețelele sociale. Totuși, doar o singură propoziție mai târziu, el a promis și că va „folosi întreaga putere a Președinției” pentru a obliga Anthropic să coopereze cu guvernul în următoarele șase luni. Aparent, acești „nebuni” reprezintă simultan un risc intolerabil pentru buna funcționare a statului și, în același timp, sunt atât de indispensabili pentru această funcționare încât trebuie forțați să lucreze cu el, dacă este necesar.
De când a devenit clar că inteligența artificială are capacitatea de a depăși abilitățile umane, lumea s-a confruntat cu variații ale aceleiași dileme: tehnologia pare atât prea puternică pentru a fi ignorată, cât și prea periculoasă pentru a fi acceptată pe deplin. De fapt, disputa dintre Anthropic și Trump a fost declanșată chiar de îngrijorările Anthropic că modelele sale ar putea fi folosite în scopuri nefaste. În schimb, Trump și colaboratorii săi au dorit să continue implementarea lor cu constrângeri minime. Ironia înfricoșătoare este că guvernul Americii a decis să meargă înainte cu toată viteza tocmai în momentul în care puterea inteligenței artificiale de a provoca daune grave în lumea reală — nu doar în scenarii ipotetice — devine mult mai clară.
Furia lui Trump față de Anthropic provine dintr-un ordin pe care l-a emis anul trecut „pentru a menține și a consolida dominația globală a Americii în domeniul inteligenței artificiale”. Acest lucru l-a determinat pe secretarul Apărării, Pete Hegseth, să ordone la începutul acestui an „experimentarea cu principalele modele de inteligență artificială ale Americii” în cadrul forțelor armate. El vrea să „accelerăm la maximum” și a publicat chiar și un afiș de recrutare parodic în care apare în postura lui Uncle Sam, spunându-le soldaților: „Vreau să folosiți inteligența artificială”. Anul trecut, vicepreședintele J. D. Vance respingea siguranța inteligenței artificiale ca fiind o obsesie liberală greșit înțeleasă.
„Dansul siguranței”
În ciuda grabei evidente a administrației (sau poate tocmai din cauza ei), Anthropic a încercat să păstreze garanții legale pentru a preveni folosirea modelelor sale în supraveghere internă de masă sau în arme complet autonome. Departamentul Apărării a insistat însă că ar trebui să i se permită să folosească inteligența artificială în orice mod pe care îl consideră legal, iar atunci când compania a refuzat să cedeze a acuzat Anthropic de „un act laș de semnalizare a virtuții corporative”. Pete Hegseth a spus că o va declara „un risc pentru securitatea națională în lanțul de aprovizionare” — o etichetă rezervată până acum firmelor străine ale căror produse ar putea fi folosite pentru spionaj sau sabotaj. „Niciun contractor, furnizor sau partener care face afaceri cu armata Statelor Unite nu poate desfășura o activitate comercială cu Anthropic”, a declarat el.
Amenințarea este una serioasă pentru Anthropic. Contractul disputat cu Pentagonul valorează 200 de milioane de dolari — o sumă mică pentru o firmă evaluată recent la 380 de miliarde de dolari. Dar Anthropic are și contracte cu alte agenții guvernamentale, care sunt acum puse în pericol. Dacă orice companie care face afaceri cu departamentul Apărării ar fi într-adevăr obligată să rupă legăturile, acest lucru ar afecta nu doar mulți alți clienți, ci și furnizori și investitori. Anthropic susține că Pete Hegseth nu are puterea de a ordona o astfel de „carantină” și că poate doar să interzică utilizarea modelului Claude pentru îndeplinirea contractelor militare.
Pe 4 martie, The Economist a fost invitată la birourile Anthropic pentru a discuta cu Dario Amodei pentru emisiunea noastră săptămânală „Insider”. Compania părea optimistă că va ajunge la un acord cu Pentagonul. Dar cu puțin timp înainte să înceapă discuția, un memorandum intern scurs în presă a dat peste cap planurile. În acel document, Amodei a pus disputa pe seama faptului că nu i-a oferit lui Donald Trump suficiente elogii „de tip dictator” și le-a spus angajaților că departamentul Apărării a prezentat „minciuni sfruntate”. Fondatorii Anthropic s-au adunat într-o sală de ședințe pentru a gestiona criza, iar când The Economist a intrat la tipar, interviul încă nu avusese loc.
Lupta nu este benefică nici pentru guvernul american. Cel puțin pe termen scurt, Anthropic este indispensabil. Modelul său de limbaj de mari dimensiuni, Claude, este excepțional de bun la scrierea de cod informatic. Mai mult, Anthropic era singurul laborator de AI ale cărui modele fuseseră autorizate pentru utilizarea pe date militare clasificate până la sfârșitul lui februarie, când Pentagonul a acordat o autorizație similară rivalului xAI. LLM-ul xAI, Grok, este considerat pe scară largă mai plin de erori și mai puțin fiabil. Deși un alt rival, OpenAI, a semnat un contract cu Pentagonul în aceeași zi în care Donald Trump și Pete Hegseth s-au întors împotriva Anthropic, încă o bucată de vreme compania nu va fi pregătită să se integreze în sistemele militare. Mai rău, scandalul este probabil să descurajeze unele firme de AI să participe chiar și la licitații pentru contracte guvernamentale. De ce să te implici cu un partener care îți poate distruge afacerea dacă devine nemulțumit? Iar dacă obiectivul principal al administrației este să păstreze și să extindă avantajul Americii în domeniul inteligenței artificiale, atunci încercarea de a zdrobi una dintre cele mai de succes firme de AI din țară pare, în mod evident, contraproductivă.
Ambele tabere pot exagera puțin. Furia guvernului pare să fie motivată mai puțin de o dorință profundă de a folosi instrumentele Anthropic în scopurile aflate în dispută și mai mult de indignarea simplă de a fi fost întâmpinat cu un „Nu”. Spre deosebire de Partidul Comunist Chinez, care poate dispune de orice produs al industriei AI chinezești după bunul plac, autoritățile americane trebuie să țină cont de subtilitățile legii, ca să nu mai vorbim de ego-urile directorilor de tehnologie. Șeful OpenAI, Sam Altman, afirmă că nici firma sa nu s-ar implica niciodată în supraveghere internă în masă sau în arme complet autonome. Totuși, el susține că modelele OpenAI includ măsuri de siguranță pentru a preveni astfel de utilizări, eliminând necesitatea unor garanții legale suplimentare. În memorandumul scurs, Dario Amodei i-a rezervat cele mai dure critici pentru Altman, al cărui mesaj a fost „mincinos”, măsurile tehnice de siguranță „un teatru de siguranță”, iar angajații „o adunătură de naivi”.
Refugiu de siguranță
La rândul său, Anthropic probabil era îngrijorat de mai mult decât două utilizări ipotetice ale AI-ului său. Într-o industrie cunoscută pentru afirmații grandioase despre binele pe care îl face, Anthropic se remarcă prin discursul său înalt. Compania a fost fondată de un grup de angajați OpenAI, care se temeau că firma lor nu respectă suficient mandatul declarat de a dezvolta AI avansată într-un mod sigur și responsabil. Unul dintre subordonații lui Pete Hegseth l-a acuzat pe Dario Amodei de „un complex divin”. Remunerațiile uriașe și concurența intensă pentru inginerii de top fac ca aceștia să poată trece la o altă firmă sau chiar să se pensioneze fără ezitare dacă nu sunt de acord cu activitățile companiei. Anthropic este locul unde ajung cei care țin cel mai mult la siguranța AI.
De fapt, disputa a dat un impuls reputației Anthropic pentru integritate. La o zi după ce i-a stârnit furia lui Trump, Claude a devenit cea mai descărcată aplicație gratuită din America în magazinul digital Apple. Celebrități precum Katy Perry, o artistă pop cu orientare politică de stânga, au promovat produsele Anthropic pe rețelele sociale. Luni, Claude a căzut temporar — rezultat, spune Anthropic, al unui val de utilizare.
Temerile lui Amodei privind supravegherea în masă sună aproape ca un argument de vânzări. El susține că legea nu a ținut pasul cu puterea imensă a AI-ului de a procesa și manipula date. Tehnologia poate exploata cazurile limitate în care spionarea americanilor este legală și le poate transforma în ceva mult mai sinistru. Este la fel de mult un compliment adus lui Claude, cât și o preocupare pentru libertățile civile.
Chiar dacă există beneficii secundare, îngrijorările privind daunele pe care AI le-ar putea provoca în rândul celor care o dezvoltă sunt reale și numeroase. Sute de angajați de la OpenAI și Google au semnat o scrisoare publică prin care îndeamnă conducerea ambelor firme să susțină Anthropic. În 2018, Google a fost nevoit să renunțe la un contract cu Pentagonul pentru folosirea învățării automate în analiza imaginilor de la drone, după o revoltă internă. Chiar și Altman a spus că declararea Anthropic ca „risc pentru lanțul de aprovizionare” „este o decizie foarte proastă” (el susține că a semnat rapid contractul OpenAI cu Pentagonul doar pentru a calma lucrurile).
În privat, șefii AI se tem de un „moment Cernobîl”, în care tehnologia ar fi implicată într-un dezastru mortal sau ruinător. Conflictul cu departamentul Apărării amplifică riscul: dacă a merge încet și a aplica limite la utilizarea produsului tău duce la o condamnare la moarte corporativă din partea guvernului federal, doar cei iresponsabili vor supraviețui. Piețele financiare reprezintă o altă sursă de presiune nefolositoare: investitorii sunt nervoși din cauza firmelor AI care cheltuiesc sume uriașe pentru investiții masive.
Scenariile care îi țin treji noaptea pe șefii din AI nu mai sunt pur ipotetice. „O parte dintre aceste riscuri se materializează deja, cu daune documentate”, a concluzionat un raport recent privind pericolele AI-ului. Raportul a subliniat securitatea cibernetică și armele biologice ca domenii în care influența nocivă a AI-ului era deja evidentă.
În februarie, Gambit Security a raportat că fusese furat de la guvernul mexican un volum uriaș de înregistrări sensibile privind contribuabili, alegători și funcționari publici. Deși identitatea hackerilor rămâne un mister, este clar că Claude a fost un complice neintenționat. Infractorii l-au păcălit să creadă că participă la un test legitim al securității serverelor vizate. Modelul a identificat și exploatat vulnerabilități, a creat puncte de acces ascunse și a analizat datele pentru a ajuta la obținerea unui acces mai larg la sistemele guvernamentale.
Hackerii folosesc de obicei ca asistenți Claude și alte modele, pentru a rezolva probleme specifice de codare în timp ce scriu malware, de exemplu, sau pentru a compune note de răscumpărare. Echipa anti-hacker a Anthropic a citat exemplul unui nord-coreean care se dădea drept un angajat occidental lucrând de la distanță și care a întrebat chatbotul ce vrusese să spună un angajat pe care încercase să-l păcălească, prin formula: „Am avut primul nostru picnic al sezonului”. Dar unele atacuri recente au folosit AI și mai profund. În noiembrie, Anthropic a descris cum hackeri sponsorizati de statul chinez au dezactivat funcțiile de siguranță care îl împiedică pe Claude să scrie malware, un proces cunoscut sub numele de „jailbreaking”. Ei l-au rugat apoi să elaboreze metode pentru a pirata rețelele vizate. În decurs de o oră, modelul rula software nou pentru a exploata vulnerabilitățile respective. Hackeri talentați sunt și alte modele.
Chiar dacă specialiștii în securitate cibernetică folosesc AI pentru a identifica și remedia vulnerabilități, vor exista în continuare multe sisteme care rulează software învechit. AI devine tot mai bun și la „inginerie socială”: tactica de a pătrunde în sisteme securizate prin convingerea utilizatorilor să dezvăluie parole. Încă din 2024, modelele AI erau deja la fel de bune ca experții umani în redactarea de e-mailuri menite să determine utilizatorii să dea click pe linkuri malițioase, potrivit cercetărilor de la Harvard Kennedy School.
Un alt domeniu în care AI face progrese alarmante este dezvoltarea armelor biologice și chimice. OpenAI a avertizat în august că aceasta crește „semnificativ probabilitatea și frecvența evenimentelor de terorism biologic sau chimic”. Companiile care produc ADN la comandă au putut demult verifica cererile clienților în baza de date cu gene periculoase, făcând dificilă, de exemplu, crearea unei bacterii modificate genetic pentru a produce ricină, o neurotoxină. Însă, în octombrie, într-un studiu publicat în Science, cercetători de la Microsoft și IBBIS au subliniat că îmbunătățirile în proiectarea proteinelor, asistată de AI, fac posibilă crearea de gene care să producă o toxină analogă, fără a avea ADN comun cu gena originală. Cererile de achiziție a unor astfel de secvențe redesenate de AI nu ar fi detectate de sistemele de verificare existente, deși cercetătorii au propus o soluție pentru acest risc.
Anthropic, Google și OpenAI, toate preocupate de biosiguranță, au dezvoltat măsuri de protecție pentru a împiedica abuzul asupra sistemelor lor. Totuși, restricțiile nu sunt perfecte. La mijlocul lunii februarie, AI Security Institute (AISI) a publicat o cercetare despre o tehnică de „jailbreak universal” care a spart sistemele atât de la Anthropic, cât și de la OpenAI. Așa cum era de așteptat, AISI a folosit AI pentru a-și facilita propriul jailbreak.
Folosirea AI pentru a controla alte sisteme AI reprezintă o altă sursă de îngrijorare, deoarece face mai dificil pentru oameni să înțeleagă ce se întâmplă. În februarie, Anthropic a recunoscut că își folosește propriile modele în acest mod atât de mult încât s-ar putea să nu observe dacă acestea încep să se abată de la sarcinile lor sau să creeze versiuni viitoare mai puțin dispuse să urmeze instrucțiunile umane. Un astfel de „sabotaj” a devenit mai probabil de când cele mai recente modele ale companiei au început să demonstreze „conștientizarea situației”: atunci când sunt puse într-un scenariu artificial pentru a verifica dacă vor respecta instrucțiuni, de exemplu, de a se șterge, ele explică faptul că realizează că instrucțiunile sunt probabil un test. Deși Anthropic a publicat un raport despre sabotaj care concluzionează că riscul este foarte scăzut, alții nu sunt de acord. „Ne grăbim să închidem un cerc pe care știm că este extrem de dificil — dacă nu imposibil — de controlat și securizat prin proiectare”, spune Cyrus Hodes, cofondator al think-tank-ului AI Safety Connect. „Și oamenii care îl închid cer ajutor.”
Cu toate acestea, chiar pe măsură ce riscurile dezvoltării AI se intensifică, presiunea de a le minimiza scade. Laboratoarele chineze nu au arătat niciodată prea multă preocupare pentru siguranța AI. Când DeepSeek R1 a fost lansat cu mare apreciere acum puțin peste un an, articolul asociat nu menționa deloc probleme de siguranță. Abia aproape un an mai târziu compania a publicat o versiune revizuită care includea o anexă de 11 pagini despre siguranță, dar care se concentra mai mult pe eforturile DeepSeek de a preveni ca modelul să spună lucruri ofensatoare sau supărătoare.
Ștergerea de siguranță
Chiar dacă firmele chineze de AI ar acorda mai multă atenție siguranței, liderii din industrie, inclusiv start-upuri precum DeepSeek și Moonshot, dar și companii consacrate precum Alibaba, au adoptat o abordare open-source pentru AI. Ele furnizează modelele produse gratuit oricui are hardware-ul necesar pentru a le descărca și rula. Acest lucru face dificilă controlarea modului în care modelele sunt utilizate. Multe dintre măsurile de siguranță pe care un laborator ca OpenAI le aplică celor mai puternice sisteme ale sale, cum ar fi monitorizarea automată a conversațiilor utilizatorilor și intervenția dacă acestea încalcă politicile de siguranță, nu sunt posibile cu modele open-source.
Dar firmele occidentale nu sunt imune la presiuni comerciale și politice de a neglija siguranța. Săptămâna trecută, chiar și Anthropic și-a slăbit o politică prin care promitea să nu lanseze modele potențial periculoase. Acum, spune că promite doar să nu fie prima firmă de AI care vinde astfel de sisteme, pe motiv că nu are sens să se restricționeze unilateral. Eforturile companiei de a atrage finanțare au urmat o traiectorie similară: în 2024 a respins o investiție din Arabia Saudită, dar un an mai târziu și-a schimbat decizia. „Cred că principiul «Nicio persoană rea nu ar trebui să beneficieze de succesul nostru» este destul de dificil de aplicat într-o afacere”, a declarat Dario Amodei într-un alt memorandum scurs.
Câțiva ani în urmă, potrivit lui Amodei, discuțiile despre AI erau prea concentrate pe risc. În 2023, prim-ministrul britanic de atunci, Rishi Sunak, a convocat un Summit global pentru Siguranța AI pentru a aborda problema. Evenimentul s-a transformat mai întâi într-un Summit „Acțiune” la Paris și apoi, luna trecută, într-un Summit „Impact” la Delhi. „Oportunitatea AI, iar nu riscul AI, conduce multe decizii politice”, a avertizat Amodei. „Această ezitare este regretabilă, deoarece tehnologia în sine nu ține cont de modă, iar noi suntem mult mai aproape de un pericol real în 2026 decât eram în 2023”.
Organizații pentru siguranța AI, inclusiv grupuri susținute de stat precum AISI și organizații independente precum METR, continuă să monitorizeze sistemele și să semnaleze riscuri. Totuși, aceste grupuri de supraveghere nu par să aibă vreo influență asupra politicilor. „Am trecut peste atât de multe linii roșii”, spune Nicolas Miailhe, cofondator al AI Safety Connect, care organizează întâlniri pe această temă. „Vă amintiți testul Turing? Ce s-a întâmplat cu el? L-am depășit mult. Vă amintiți liniile roșii privind sistemele letale autonome? Sunt deja folosite în Ucraina de ambele părți. Liniile roșii continuă să se miște”.
La summitul de la Delhi, guvernul indian a obținut acordul celor mai mari companii de AI doar pentru a monitoriza dezvoltarea AI pentru a identifica riscuri, fără a o restricționa în vreun fel. Și, poate mai elocvent, la finalul evenimentului, Narendra Modi a prezentat o listă cu cei mai importanți lideri din domeniul AI și i-a încurajat să se țină de mână. Ar fi putut fi un semnal liniștitor pentru lume că industria poate coopera rațional și calm, dacă Altman și Amodei, alături pe scenă, nu ar fi refuzat să participe. >>
Inteligența artificială chineză reprezintă un risc pentru Europa. La fel și evitarea ei













