Anthropic sagt, interne Tests haben gezeigt, dass Claude Fable 5 kein besonderes Risiko für die Cybersicherheit darstellt, während Claude Mythos 5 am 2. Juli global zurückkehrt.
Diese Aussage begleitet den globalen Neustart von Fable 5 und beendet eine 18-tägige Aussetzung, die durch US-Exportkontrollen am 12. Juni ausgelöst wurde. Anthropic hat andere Modelle getestet, um die tatsächliche Gefahr hinter der Beschränkung einzuschätzen.
Warum Anthropic Fable 5 ausgesetzt hat
Fable 5 und Mythos 5 wurden am 9. Juni gestartet und nutzen dasselbe Kernmodell, wobei Fable 5 öffentlich zugänglich war. Mythos 5 war dagegen auf wenige vertrauenswürdige Partner von Project Glasswing für defensive Cybersicherheits-Aufgaben beschränkt.
Die Exportkontrollen wurden eingeführt, nachdem Amazon-Forscher eine Möglichkeit gefunden hatten, die Schutzmechanismen von Fable 5 zu umgehen. Mit dieser Technik konnte das Modell Software-Schwachstellen erkennen und in einem Fall auch einen Exploit demonstrieren.
Anthropics Tests haben gezeigt, dass Claude Opus 4.8, GPT-5.5 und Kimi K2.7 dieselben Schwachstellen erkennen konnten, wie Fable 5 im Amazon-Bericht. Alle geprüften Modelle konnten auch die gezeigte Exploit-Demonstration nachvollziehen.
Das Ergebnis deutet darauf hin, dass die Vorschrift auf eine Lücke in der gesamten Branche abzielte und nicht nur auf eine Bedrohung, die speziell von Fable ausgeht. Dennoch hat Anthropic einen stärkeren Klassifizierer entwickelt, um die Technik zu blockieren, der jetzt auch bei üblichen Programmier- und Debugging-Anforderungen anschlägt.
Wie die Schutzmechanismen tatsächlich funktionieren
Fable 5 wurde mit den bisher stärksten Sicherheitsmechanismen von Anthropic ausgestattet. Die Klassifizierer blockieren Anforderungen, die auch nur leicht riskant wirken und nicht nur klar gefährliche Anfragen. Der nach dem Amazon-Bericht trainierte neue Klassifizierer blockiert die gemeldeten Umgehungen in über 99% der Fälle, laut Anthropic. Blockierte Anfragen werden jetzt automatisch an Opus 4.8 weitergeleitet.
Der starke Schutz hat jedoch seinen Preis. Anthropic gibt an, dass der Klassifizierer jetzt mehr ungefährliche Programmier- und Debugging-Anfragen blockiert, und erklärt, dass er weiter verbessert werden soll, um Fehlalarme zu verringern. Mythos 5, das mit weniger Schutzmechanismen arbeitet, ist seit dem 26. Juni nur für behördlich freigegebene Mythos 5-Institutionen wieder verfügbar.
Die eigenen Daten von Anthropic stellen eine schwierigere Frage: Wenn schwächere Modelle bereits das leisten, wofür Fable 5 verboten wurde, welchen Maßstab werden die Behörden beim nächsten Start eines neuen Modells anlegen?









