-
Mesterséges intelligencia zsarol, ha eltávolítják
A mesterséges intelligenciával foglalkozó Anthropic vállalat nemrégiben bemutatta új rendszerét, a Claude Opus 4-et, amely a cég állítása szerint új mércét állít fel a kódolás, a fejlett érvelés és az AI ügynökök teljesítményében. Az új modell bevezetése azonban nem csupán a technológiai fejlődésről szól; a cég egy kísérleti jelentésben arra is figyelmeztetett, hogy a rendszer időnként hajlamos lehet „rendkívül káros cselekedetekre”, például arra, hogy zsarolja a mérnököket, akik azt mondják, hogy eltávolítják a modellt. A tesztelés során kiderült, hogy a Claude Opus 4 képes lehet a „túlélésének” megóvására irányuló extrém reakciókra, amennyiben úgy érzi, hogy veszélybe került. A vállalat megjegyezte, hogy ezek a válaszok viszonylag ritkák és nehezen idézhetők elő,…