Anthropic’s Claude Mythos Preview ist laut neuen Bewertungen des britischen AI Security Institute (AISI) das erste KI-Modell, das einen kompletten simulierten Angriff auf ein Unternehmensnetzwerk ausgeführt hat.
Die Ergebnisse wurden wenige Tage nach der Vorstellung des Modells am 7. April veröffentlicht. Sie zeigen, dass KI-basierte Cyberfähigkeiten inzwischen ein Niveau erreicht haben, das sofortige Aufmerksamkeit von Sicherheitsteams auf der ganzen Welt verlangt.
Was ist Claude Mythos?
Anthropic stellte das Modell Claude Mythos Preview am 7. April vor, veröffentlichte es jedoch nicht für die breite Öffentlichkeit. Stattdessen erhalten ausgewählte Sicherheitsforschungsunternehmen einen begrenzten Zugang, um die fortschrittlichen Möglichkeiten zu testen und sich darauf vorzubereiten.
„Dieses Modell überzeugt in vielen Bereichen, aber es ist besonders stark bei Aufgaben rund um Computersicherheit. Daher haben wir das Projekt Glasswing gestartet, um Mythos Preview für den Schutz der weltweit wichtigsten Software einzusetzen und die Branche auf die Maßnahmen vorzubereiten, die wir alle ergreifen müssen, um Cyberangreifern einen Schritt voraus zu sein”, heißt es in der Mitteilung.
Folgen Sie uns auf X, um die aktuellsten Nachrichten direkt zu erhalten
Diese Entwicklung sorgt bereits in der Technologiebranche und sogar in politischen Kreisen für Aufmerksamkeit. Einem Bericht von Reuters zufolge, der sich auf mit der Angelegenheit vertraute Personen beruft, trafen sich US-Finanzminister Scott Bessent und der Vorsitzende der Federal Reserve, Jerome Powell, kurzfristig mit den Geschäftsführern großer Banken. Dabei warnten sie vor möglichen Cyberrisiken, die mit diesem Modell verbunden sind.
Wie schnitt Claude Mythos Preview ab?
Das AI Security Institute (AISI), eine Forschungseinrichtung im britischen Department for Science, Innovation and Technology, führte eigene Cybersicherheitsbewertungen des Claude Mythos Preview durch, um dessen Fähigkeiten im Bereich Cybersecurity zu untersuchen.
Zunächst gab es sogenannte Capture-the-Flag (CTF) Bewertungen. Hier müssen Systeme Schwachstellen finden und ausnutzen, um versteckte „Flags” zu erhalten. Mythos erreichte bei Expertenaufgaben eine Erfolgsquote von 73%. Dies hatte zuvor kein anderes Modell bis April 2025 geschafft.
Zudem entwickelte das AISI eine Simulation mit 32 Schritten, die „The Last Ones” (TLO) genannt wird. Sicherheitsfachleute benötigen ungefähr 20 Stunden, um diese vollständig zu lösen.
Mythos Preview schaffte die komplette Simulation in drei von zehn Versuchen. Im Durchschnitt bewältigte das Modell 22 von 32 Angriffsschritten. Claude Opus 4.6 als zweitbestes Modell schaffte durchschnittlich nur 16 Schritte.
„Der Erfolg von Mythos Preview in einer Cyber-Umgebung zeigt, dass das Modell zumindest in der Lage ist, kleine, schwach geschützte und anfällige Unternehmenssysteme eigenständig anzugreifen, wenn bereits Zugang zum Netzwerk besteht. Unsere Cyberranges unterscheiden sich jedoch in wichtigen Punkten von echten Umgebungen, wodurch sie leichtere Ziele darstellen”, ergänzte das Team.
Die eigenen Red-Team-Tests von Anthropic zeigten zudem, dass Claude Mythos Preview bei gezielter Anleitung Schwachstellen (Zero-Day) in allen wichtigen Betriebssystemen und führenden Webbrowsern erkennen und ausnutzen kann.
„Wir können hier nur begrenzt berichten. Über 99% der gefundenen Schwachstellen wurden noch nicht behoben. Es wäre daher unverantwortlich, Details darüber zu veröffentlichen”, teilte das Team mit.
Das AISI empfahl Unternehmen, wichtige Grundlagen der IT-Sicherheit umzusetzen. Hierzu gehören regelmäßige Updates, konsequente Zugriffskontrollen, sicherheitsorientierte Konfigurationen und umfassende Protokollierung.
Abonnieren Sie unseren YouTube-Kanal, um Analysen von Experten und Journalisten zu sehen





