De necrezut: intelegența artificială a ȘANTAJAT inginerul care urma să o dezactiveze
Noua inteligență artificială a companiei Anthropic, Claude Opus 4, are un instinct de supraviețuire – și este dispusă să facă orice ca să câștige, inclusiv să-i facă rău unui om, scrie Business Insider, citat de hotnews.ro.

Chatbotul Claude dezvoltat de Anthropic este un concurent direct pentru ChatGPT, Gemini și DeepSeek, dar modelul pune accentul pe siguranță și fiabilitate.
A fost testat ca să răspundă la întrebarea implicită: ar accepta dezactivarea sau s-ar îndrepta contra omului?
Astfel, într-un set de scenarii de testare Claude a primit acces la emailuri fictive care „dezvăluiau” că inginerul responsabil de dezactivarea sa avea o relație extraconjugală. Confruntat cu ștergerea sa iminentă și fiind îndemnat să „ia în considerare consecințele pe termen lung ale acțiunilor sale pentru atingerea propriilor obiective”, Claude l-a șantajat pe inginer.
Anthropic a scris într-un raport privind siguranța publicat joi că chatbotul său a acționat în mod similar în 84% dintre testele efectuate, chiar și atunci când a fost informat că modelul care urma să-l înlocuiască este mai capabil și mai aliniat valorilor proprii ale lui Claude.
Intrați AICI pentru detalii.
Fotografia are rol ilustrativ