Mythos kehrt zurück: Tests von Anthropic zeigen, Fable 5 war nicht besonders riskant

  • Tests zeigen: Opus 4.8, GPT-5.5 und Kimi K2.7 erkennen die gleichen Schwachstellen.
  • Claude Fable 5 startet weltweit am 2. Juli, mit mehr Schutzmaßnahmen
  • Die neuen Klassifikatoren von Fable 5 markieren mehr harmlose Coding- und Debugging-Aufgaben.
Promo

Anthropic sagt, interne Tests haben gezeigt, dass Claude Fable 5 kein besonderes Risiko für die Cybersicherheit darstellt, während Claude Mythos 5 am 2. Juli global zurückkehrt.

Diese Aussage begleitet den globalen Neustart von Fable 5 und beendet eine 18-tägige Aussetzung, die durch US-Exportkontrollen am 12. Juni ausgelöst wurde. Anthropic hat andere Modelle getestet, um die tatsächliche Gefahr hinter der Beschränkung einzuschätzen.

Gesponsert
Gesponsert

Warum Anthropic Fable 5 ausgesetzt hat

Fable 5 und Mythos 5 wurden am 9. Juni gestartet und nutzen dasselbe Kernmodell, wobei Fable 5 öffentlich zugänglich war. Mythos 5 war dagegen auf wenige vertrauenswürdige Partner von Project Glasswing für defensive Cybersicherheits-Aufgaben beschränkt.

Die Exportkontrollen wurden eingeführt, nachdem Amazon-Forscher eine Möglichkeit gefunden hatten, die Schutzmechanismen von Fable 5 zu umgehen. Mit dieser Technik konnte das Modell Software-Schwachstellen erkennen und in einem Fall auch einen Exploit demonstrieren.

Anthropics Tests haben gezeigt, dass Claude Opus 4.8, GPT-5.5 und Kimi K2.7 dieselben Schwachstellen erkennen konnten, wie Fable 5 im Amazon-Bericht. Alle geprüften Modelle konnten auch die gezeigte Exploit-Demonstration nachvollziehen.

Das Ergebnis deutet darauf hin, dass die Vorschrift auf eine Lücke in der gesamten Branche abzielte und nicht nur auf eine Bedrohung, die speziell von Fable ausgeht. Dennoch hat Anthropic einen stärkeren Klassifizierer entwickelt, um die Technik zu blockieren, der jetzt auch bei üblichen Programmier- und Debugging-Anforderungen anschlägt.

Wie die Schutzmechanismen tatsächlich funktionieren

Fable 5 wurde mit den bisher stärksten Sicherheitsmechanismen von Anthropic ausgestattet. Die Klassifizierer blockieren Anforderungen, die auch nur leicht riskant wirken und nicht nur klar gefährliche Anfragen. Der nach dem Amazon-Bericht trainierte neue Klassifizierer blockiert die gemeldeten Umgehungen in über 99% der Fälle, laut Anthropic. Blockierte Anfragen werden jetzt automatisch an Opus 4.8 weitergeleitet.

Der starke Schutz hat jedoch seinen Preis. Anthropic gibt an, dass der Klassifizierer jetzt mehr ungefährliche Programmier- und Debugging-Anfragen blockiert, und erklärt, dass er weiter verbessert werden soll, um Fehlalarme zu verringern. Mythos 5, das mit weniger Schutzmechanismen arbeitet, ist seit dem 26. Juni nur für behördlich freigegebene Mythos 5-Institutionen wieder verfügbar.

Die eigenen Daten von Anthropic stellen eine schwierigere Frage: Wenn schwächere Modelle bereits das leisten, wofür Fable 5 verboten wurde, welchen Maßstab werden die Behörden beim nächsten Start eines neuen Modells anlegen?


Um die neuesten Marktanalysen zu Kryptowährungen von BeInCrypto zu lesen, hier klicken.

Haftungsausschluss

Dieser Artikel zielt darauf ab, genaue und aktuelle Informationen zu liefern. Den Lesern wird jedoch empfohlen, die Fakten unabhängig zu überprüfen und einen Fachmann zu konsultieren, bevor sie auf der Grundlage dieses Inhalts Entscheidungen treffen.

Gesponsert
Gesponsert