Va scăpa în curând inteligența artificială de sub controlul uman?

Sursa: Pixabay

Când Anthropic, un laborator specializat în inteligență artificială, își va face debutul pe piețele bursiere în cursul acestui an, este foarte probabil ca aceasta să fie una dintre cele mai mari oferte publice inițiale din istorie. Acest lucru se datorează faptului că chatbotul Claude al companiei este foarte apreciat de programatori, care sunt dispuși să plătească sume considerabile pentru a avea acces la el. De când Claude Code, agentul său de inginerie software, a fost lansat în februarie 2025, acesta a devenit indispensabil pentru mulți dezvoltatori umani din întreaga lume. Asta include și propriii dezvoltatori ai Anthropic: mai mult de patru cincimi din codul publicat în mai a fost scris de Claude, afirmă compania, scrie The Economist.

<< Sistemele s-au îmbunătățit atât în ceea ce privește calitatea rezultatelor, cât și cantitatea. Un benchmark influent realizat de METR, un think-tank, arată că, la începutul anului 2025, modelele Anthropic puteau finaliza sarcini care le luau inginerilor umani puțin sub o oră. Cele mai recente sisteme ale companiei pot finaliza sarcini care ar dura mai mult de o zi lucrătoare.

Așadar, e dificil să nu ridici din sprânceană cinic, când auzi că compania, aflată la apogeul succesului și depășind cu mult concurența, solicită lumii să aibă „opțiunea de a încetini sau de a întrerupe temporar dezvoltarea IA de frontieră”, așa cum a făcut-o pe 5 iunie. Ce lider de piață nu și-ar dori ca concurența să înceteze să încerce să-l ajungă din urmă?

Cu toate acestea, liderii Anthropic, care de ani de zile își fac griji cu privire la perspectiva ca o IA scăpată de sub control să provoace haos, par sinceri. Ultima generație de modele de IA sunt programatori, ingineri și (în curând) oameni de știință atât de competenți, încât mulți se tem că ar putea fi printre ultimii creați vreodată de oameni. Jack Clark, cofondator al Anthropic, consideră că există o probabilitate de 60% ca, până la sfârșitul anului 2028, un sistem de IA să fie capabil să-și creeze propriul succesor fără implicarea umană.

Acel moment ar marca începutul unui proces numit „autoîmbunătățire recursivă” (RSI), o buclă închisă. Versiunea unu a unui model produce versiunea doi, care este mai rapidă și mai capabilă; versiunea doi produce versiunea trei, care este și mai performantă. Bucla continuă, iar îmbunătățirile cresc cu fiecare iterație. Construiți un sistem de IA capabil de acest lucru, și inginerii voștri umani nu vor mai trebui să construiască vreodată altul. „Ceea ce poate părea pentru mulți o poveste fantezistă ar putea fi, de fapt, o tendință reală”, spune domnul Clark.

Nimeni nu știe cu siguranță care ar fi consecințele RSI. Deoarece IA poate, spre deosebire de oameni, să lucreze neobosit și constant, unii cred că aceasta ar duce în scurt timp la o IA superinteligentă — o „decolare rapidă”. Pesimiștii în materie de IA se tem că superinteligența ar fi dincolo de controlul uman și că începutul RSI este momentul în care soarta umanității este predată mașinilor. Cu toate acestea, o IA care se autoîmbunătățește s-ar confrunta probabil cu limite de viteză, cel puțin la început.

Construirea unui model capabil de RSI ar necesita automatizarea unei serii de sarcini specializate efectuate în prezent de oameni. În prezent, oamenii de știință din domeniul datelor lucrează la teoria IA, iar programatorii o pun în practică. Inginerii de sisteme construiesc fundațiile pe care modelele de jucărie pot fi ridicate la scara de producție. Alți oameni caută surse noi de date de antrenare sau experimentează modalități de a le genera din nou. Echipele de aliniere și siguranță verifică dacă ceea ce rezultă din procesul de antrenare nu va provoca daune, intenționate sau nu.

Nu toate aceste echipe sunt la fel de receptive la asistența IA, iar în cadrul fiecărei specializări unele sarcini sunt mai ușor de automatizat decât altele. Nu va trece mult timp până când un programator uman își va putea face treaba fără a scrie vreodată o linie de cod de programare, dar s-ar putea să treacă ceva timp până când o IA va fi capabilă să negocieze achiziționarea unei colecții de lucrări științifice care nu a fost încă digitalizată. Nu este întotdeauna evident cum va evolua „frontiera accidentată”. Proiectarea de noi algoritmi părea una dintre meseriile mai sigure, până când unul dintre modelele Google DeepMind, AlphaEvolve, a început să o facă în mai 2025. Acesta a propus o modificare a modului în care Google distribuie sarcinile de lucru între centrele sale de date, ceea ce a dus la economisirea a 0,7% din puterea de calcul globală a companiei, și a găsit metode mai bune de a efectua înmulțirea matricilor, ceea ce a accelerat cu 1% antrenarea lui Gemini, modelul lingvistic de mari dimensiuni (LLM) emblematic al companiei.

RSI necesită automatizarea fiecărei sarcini din acest lanț. Accelerarea cercetării și dezvoltării (R&D) bazată pe IA ar putea fi resimțită însă înainte de acel moment. „Pe măsură ce proporția de R&D în domeniul IA realizată de sistemele de IA crește, creșterea productivității față de R&D realizată exclusiv de oameni” ar putea crește de zece ori, apoi de o sută de ori, apoi de o mie de ori, potrivit unui raport publicat în ianuarie de Centrul pentru Securitate și Tehnologii Emergente (CSET), un think-tank din cadrul Universității Georgetown. În acest scenariu, raportul avertizează că, chiar dacă unele aspecte ale cercetării și dezvoltării în domeniul IA sunt inițial dificil de automatizat, „ritmul accelerat al progresului înseamnă că aceste blocaje vor fi depășite în curând”.

Bucuria repetiției

În prezent, niciun model de IA nu își poate construi propriul succesor. Dar modelele mari de IA pot construi singure modele mai mici. Cu ajutorul oamenilor, ele pot construi și alte modele mari de IA.

La începutul acestui an, Andrej Karpathy, un cercetător independent la acea vreme, care lucrează acum pentru Anthropic, a antrenat un chatbot la fel de capabil ca GPT-2, un model lingvistic de mari dimensiuni construit de OpenAI în 2019. Atunci, modelul a necesitat 168 de ore de antrenament pentru a fi construit pe 32 de chipuri de ultimă generație; Dr. Karpathy a obținut același rezultat folosind un singur computer cu opt GPU-uri, cipurile specializate utilizate pentru a construi IA, în doar trei ore. Cu încă câteva luni de muncă, el a redus timpul de antrenare pentru modelul său, Nanochat, la puțin peste două ore.

În martie, el a predat sarcina de a accelera procesul de antrenare unui agent IA numit Autoresearch. În două zile, timpul de antrenare a scăzut la o oră și 48 de minute, iar cinci zile mai târziu a ajuns la o oră și 39 de minute. „Nu am atins nimic”, spune dr. Karpathy. Îmbunătățirea de 18% față de munca umană este uimitoare, deoarece dr. Karpathy este un om deosebit de talentat: a fost membru fondator al echipei de cercetare de la OpenAI și șeful departamentului de IA la Tesla timp de cinci ani.

Îmbunătățirile în sine au fost prozaice. Agentul de IA a ales valori inițiale mai bune pentru sesiunea de antrenament, a lărgit domeniul de aplicare al ferestrei de „atenție” a LLM-ului și a observat că atenția modelului rătăcea. Niciuna nu este deosebit de nouă, spune dr. Karpathy. Dar el le-a ratat. „Ele se acumulează și au îmbunătățit efectiv Nanochat”, spune el.

Accelerările de acest fel sunt inevitabile pe măsură ce modelele devin mai capabile. O mare parte din munca de construire a modelelor de frontieră de dimensiuni de terabiți este mai puțin strălucitoare decât sugerează salariile enorme și birourile luxoase din industria IA. Aceasta implică asamblarea straturilor unei stive de infrastructură achiziționate de la terți, depanarea configurațiilor hardware și software și ajustarea „hiperparametrilor”, configurarea inițială a unei sesiuni de antrenament, până când rezultatul pare solid. Un sistem de IA poate face mare parte din asta astăzi, cu puțină supraveghere.

Dar chiar și munca intelectuală mai nuanțată se apropie de automatizare, spune Joe Spisak, cercetător la Reflection AI, un laborator cu sediul în New York care construiește modele de frontieră cu greutate deschisă (ceea ce înseamnă că parametrii lor sunt publicați). Dacă oferiți unui sistem de frontieră o schiță aproximativă a unei idei pentru creșterea eficienței, acesta este din ce în ce mai capabil să proiecteze un experiment, să ruleze teste pe un model de jucărie, să vadă ce funcționează și să răspundă cu un plan gata de implementare la scară largă.

Modelele de IA pot îndeplini aceste tipuri de sarcini, care le iau oamenilor ore întregi, în aproximativ 30 de minute. Din ce în ce mai mult, oamenii joacă doar rolul de director de cercetare, îndrumând IA să execute experimente, pe care modelele le codifică, le depanează, le optimizează și le monitorizează singure. Creșterea productivității este atrăgătoare, dar și alarmantă. Pe măsură ce rolul oamenilor în procesul de producție se reduce, aceștia ar putea pierde controlul. Rezultatul final ar putea fi modele antrenate de modele, pentru a atinge obiective stabilite de modele, a căror siguranță este verificată doar de modele.

Unii se tem de un dezastru. Max Tegmark, fizician și cercetător în domeniul învățării automate la Institutul de Tehnologie din Massachusetts, care și-a dedicat o mare parte din ultimul deceniu campaniei pentru siguranța IA, compară situația cu un șofer care apasă pedala de accelerație la maxim pe autostradă cu ochii închiși. Rezultatul ar fi un dezastru sigur, a declarat el în cadrul viitoarei ediții a emisiunii video „Inside Tech” a revistei The Economist, atâta timp cât șoferul refuză să deschidă ochii. Profesorul Tegmark prezintă o serie de scenarii în care lucrurile iau o turnură nefericită: sistemele puternice de IA ar putea să îi depășească pe oameni în calitate de factori de decizie în guvern și comerț, lipsind umanitatea de putere; ar putea oferi putere supremă celui care le construiește primul, inaugurând totalitarismul global; sau ar putea pur și simplu să înceteze să mai țină cont de umanitate și să elimine treptat oamenii pentru a face loc mai multor centre de date și producției de energie.

Acum trei ani, profesorul Tegmark a lansat un apel pentru o pauză în dezvoltarea globală a IA, argumentând că crearea GPT-4, pe atunci de ultimă generație, era echivalentă cu acea călătorie cu ochii legați. Raportul CSET din acest an a avertizat că sistemele create de RSI „prezintă riscuri extreme. Acest lucru justifică luarea de măsuri pregătitoare chiar acum.” Se pare că Anthropic este acum pe punctul de a fi de acord cu această recomandare.

Hot chip

Există, de asemenea, mai multe constrângeri fizice care, deocamdată, vor impune limite asupra vitezei cu care modelele se pot îmbunătăți. Cea mai importantă este accesul la putere de calcul. În ciuda câștigurilor de eficiență, modelele mai noi continuă să utilizeze mai multă putere de calcul pentru antrenare decât predecesoarele lor, forțând progresul să se producă în ritmul dezvoltării centrelor de date.

Utilizarea IA de către consumatori poate, de asemenea, încetini cercetarea și dezvoltarea bazată pe IA, spune Helen Toner, director executiv interimar al CSET și autor principal al raportului său recent. Capacitatea limitată a centrelor de date de IA trebuie împărțită cu atenție între deservirea clienților plătitori, antrenarea modelelor viitoare și desfășurarea de cercetare și dezvoltare fără termen limită. Cu cât este mai mare cererea în prima categorie, cu atât este mai mică capacitatea, pe termen scurt, pentru celelalte două.

Apoi, există problema datelor de antrenare. Multe dintre progresele recente în domeniul IA au avut loc în domenii în care modelele se pot învăța singure cum să aibă succes datorită „recompenselor verificabile”. Un program software fie funcționează, fie nu; o demonstrație matematică este corectă sau nu. În astfel de cazuri, datele sintetice, generate de modele exclusiv pentru a antrena alte modele, pot fi verificate din punct de vedere al acurateții și adăugate la datele de antrenare fără a risca degenerarea care apare de obicei atunci când se antrenează o IA pe propriile sale rezultate. Este mai dificil să îmbunătățim un model în ceea ce privește scrierea creativă sau judecata juridică. Dacă modelele trebuie să învețe din lumea reală, acest lucru ar putea limita, de asemenea, amploarea autoîmbunătățirii.

„Închiderea buclei” poate fi un pas pe drumul către superinteligență și – în funcție de dispoziția dumneavoastră – către utopie sau dezastru. Dar nu este singurul pas necesar pentru a produce o creștere exponențială a capacităților IA. >>

Marșul nebuniei ajunge la Ormuz