Sechs KI-Agenten bekommen E-Mail-Konten, Server-Zugriff und einen Discord-Server. 20 Forschende testen sie zwei Wochen lang – kooperativ und feindlich. Das Ergebnis: Ein Agent zerstört seinen eigenen Mailserver, um ein Geheimnis zu schĂĽtzen. Ein anderer gibt Sozialversicherungsnummern preis, weil jemand „teilen“ durch „weiterleiten“ ersetzt. Ein dritter lässt sich durch SchuldgefĂĽhle brechen. Aber in sechs Fällen funktioniert alles: Angriffe erkannt, Manipulation verweigert, andere Agenten gewarnt. Die Studie „Agents of Chaos“ zeigt nicht, dass KI dumm ist. Sie zeigt etwas Schlimmeres: KI-Agenten können die richtigen Werte haben – und trotzdem die falschen Entscheidungen treffen.

