
KI drohte Firmenmitarbeiter mit Veröffentlichung von Affäre
Die KI-Firma Anthropic hat bei Tests festgestellt, dass ihre Software mit Künstlicher Intelligenz nicht vor Erpressung zurückschrecken würde, um sich zu schützen. Das Szenario bei dem Versuch war der Einsatz als
Exclusive: New Claude Model Triggers Stricter Safeguards at Anthropic
https://time.com/7287806/anthropic-claude-4-opus-safety-bio-risk/
System Card: Claude Opus 4 & Claude Sonnet 4
https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf