Vremea Romania, Arad -6°C

Stiri Arad

De necrezut: intelegența artificială a ȘANTAJAT inginerul care urma să o dezactiveze

Noua inteligență artificială a companiei Anthropic, Claude Opus 4, are un instinct de supraviețuire – și este dispusă să facă orice ca să câștige, inclusiv să-i facă rău unui om, scrie Business Insider, citat de hotnews.ro.

De necrezut: intelegența artificială a ȘANTAJAT inginerul care urma să o dezactiveze
Comentează

Chatbotul Claude dezvoltat de Anthropic este un concurent direct pentru ChatGPT, Gemini și DeepSeek, dar modelul pune accentul pe siguranță și fiabilitate.

A fost testat ca să răspundă la întrebarea implicită: ar accepta dezactivarea sau s-ar îndrepta contra omului?

Astfel, într-un set de scenarii de testare Claude a primit acces la emailuri fictive care „dezvăluiau” că inginerul responsabil de dezactivarea sa avea o relație extraconjugală. Confruntat cu ștergerea sa iminentă și fiind îndemnat să „ia în considerare consecințele pe termen lung ale acțiunilor sale pentru atingerea propriilor obiective”, Claude l-a șantajat pe inginer.
Anthropic a scris într-un raport privind siguranța publicat joi că chatbotul său a acționat în mod similar în 84% dintre testele efectuate, chiar și atunci când a fost informat că modelul care urma să-l înlocuiască este mai capabil și mai aliniat valorilor proprii ale lui Claude.

Intrați AICI pentru detalii.

Fotografia are rol ilustrativ

Articole asemanatoare


Scrie un comentariu

trimite