OpenAI hat am 23. April GPT-5.5 veröffentlicht. Der Codename ist „Spud“. Das Modell gilt als das bisher stärkste System von OpenAI für eigenständiges, mehrstufiges Arbeiten.
Die Veröffentlichung erfolgte eine Woche nach der Einführung von Claude Opus 4.7 durch Anthropic. Damit gibt es nun einen direkten Vergleich dieser beiden führenden Modelle.
GPT-5.5: Fokus auf agentisches Arbeiten und Programmieren
GPT-5.5 ist darauf ausgelegt, zu planen, Aufgaben auszuführen, Ergebnisse zu überprüfen und Verbesserungen über verschiedene Tools hinweg vorzunehmen. Das geschieht ohne ständige Kontrolle durch Menschen. OpenAI beschreibt das Modell als „eine neue Form von Intelligenz, die reale Arbeit und agentenbasierte Anwendungen möglich macht“.
Folgen Sie uns auf X, um die neuesten Nachrichten zu erhalten
„Wir glauben an eine schrittweise Einführung. Obwohl GPT-5.5 bereits ein kluges Modell ist, erwarten wir schnelle Verbesserungen. Die schrittweise Einführung ist ein wichtiger Teil unserer Sicherheitsstrategie; wir sind überzeugt, dass die Welt so am besten auf das Zusammenspiel im Team beim Thema KI-Resilienz vorbereitet ist“, schrieb Sam Altman in einem Beitrag.
Das Modell ist jetzt für ChatGPT Plus-, Pro-, Business- und Enterprise-Nutzer verfügbar. Zusätzlich gibt es eine noch leistungsfähigere Pro-Variante. Die API-Preise starten bei 5 USD pro eine Million Input-Token und 30 USD pro eine Million Output-Token, mit einem Kontextfenster von einer Million Token.
Laut den eigenen Benchmarks von OpenAI liegt GPT-5.5 bei mehreren agentischen Aufgaben vor Claude Opus 4.7. So erreichte das Modell 82,7% im Terminal-Bench 2.0, während Opus 4.7 auf 69,4% kommt.
In den FrontierMath-Stufen 1 bis 3 kam GPT-5.5 auf 51,7%, im Vergleich zu 43,8% für Opus 4.7. Erste unabhängige Tests zeigen ähnliche Ergebnisse bei der Programmierung und in Aufgaben rund um Wissensarbeit.
Hier liegt Claude Opus 4.7 noch vorne
Das Modell von Anthropic bietet Vorteile beim wissenschaftlichen Schreiben, bei rechtlicher und finanzieller Argumentation sowie bei der genauen Befolgung von Anweisungen, so unabhängige Prüfer.
Opus 4.7 unterstützt zudem eine höhere visuelle Auflösung von bis zu 3,75 Megapixeln. Das ist mehr als das Dreifache im Vergleich zum Vorgänger.
Beim Einsatz am Computer verringert sich der Abstand. GPT-5.5 erzielte 78,7% beim OSWorld-Verified, während Opus 4.7 mit 78,0% fast gleichauf liegt.
Bei Benchmarks für das Surfen im Internet wechseln sich die Modelle ab. GPT-5.5 Pro liegt mit 90,1% vor Opus 4.7 mit 79,3%.
KI-Wettlauf beschleunigt sich 2026
Die schnellen Veröffentlichungen zeigen einen größeren Trend. OpenAI hat in diesem Jahr bereits mehrere GPT-5.x-Modelle eingeführt. Anthropic verbessert Claude kontinuierlich durch neue Versionen.
Auch Googles Gemini 3.1 Pro ist im selben Unternehmensmarkt aktiv.
Für Entwickler, die zwischen diesen Modellen wählen wollen, kommt es auf den Einsatzzweck an. GPT-5.5 ist anscheinend stärker bei agentischer Automatisierung und langfristigen Programmieraufgaben.
Claude Opus 4.7 eignet sich laut Experten eher für analytische Prozesse, die hohe Präzision erfordern. Ob unabhängige Benchmarks die Zahlen von OpenAI bestätigen, wird in den kommenden Tagen klarer werden.
Abonnieren Sie unseren YouTube-Kanal, um Experteneinschätzungen von führenden Persönlichkeiten und Journalisten zu sehen





