Erpressungs-KI

 

KI drohte Firmenmitarbeiter mit Veröffentlichung von Affäre

Die KI-Firma Anthropic hat bei Tests festgestellt, dass ihre Software mit Künstlicher Intelligenz nicht vor Erpressung zurückschrecken würde, um sich zu schützen. Das Szenario bei dem Versuch war der Einsatz als 

https://www.derstandard.at/story/3000000271115/ki-drohte-firmenmitarbeiter-mit-veroeffentlichung-von-affaere

 

Exclusive: New Claude Model Triggers Stricter Safeguards at Anthropic

https://time.com/7287806/anthropic-claude-4-opus-safety-bio-risk/

 

System Card: Claude Opus 4 & Claude Sonnet 4

https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf