Anthropic und OpenAI haben am Dienstag einen neuen Schwerpunkt in ihrem Wettbewerb gesetzt, beide fokussieren sich nun verstärkt auf wissenschaftliche Forschung. Anthropic stellte Claude Science vor, eine KI-Arbeitsumgebung für Forscher. OpenAI veröffentlichte GeneBench-Pro, einen neuen Benchmark für die computergestützte Biologie.
Die Veröffentlichungen am selben Tag führen das Wettrennen der KI über Chatbots und Programmierung hinaus in die Laborarbeit. Ein Unternehmen stellte ein Werkzeug bereit, das Wissenschaftler bereits heute nutzen können. Das andere entwickelte einen Maßstab, um zu zeigen, wie weit die Technologie noch gehen muss.
Was Claude Science von Anthropic bietet
Claude Science vereint die Datenbanken, den Code und die Rechenleistung, die Forscher benötigen, in einer einzigen Anwendung. Es verbindet mehr als 60 wissenschaftliche Datenbanken aus den Bereichen Genomik, Proteomik und Chemoinformatik.
Claude Science ist eine Anwendung und kein neues Modell. Die App erscheint, während die leistungsstärksten Modelle Fable 5 und Mythos 5 von Anthropic weiterhin aufgrund der US-Exportvorschriften eingeschränkt sind. Jedes Ergebnis ist nachvollziehbar und kann auf den Ursprungscode zurückgeführt werden.
Die Arbeitsumgebung erweitert den Schwerpunkt auf Lebenswissenschaften, den Anthropic seit Oktober 2025 verfolgt. Während der Beta-Phase nutzte Jérôme Lecoq vom Allen Institute die App, um Prüfungen, die zuvor bis zu zwei Jahre dauerten, deutlich schneller zu erledigen.
Anthropic unterstützt zudem bis zu 50 Forschungsprojekte mit jeweils bis zu 30.000 USD in Form von Guthaben.
OpenAI setzt mit GeneBench-Pro neue Maßstäbe
Kurz nach der Veröffentlichung von Claude Science durch Anthropic stellte OpenAI GeneBench-Pro vor. Es prüft, ob KI-Systeme Entscheidungen treffen können, die bei echter biologischer Forschung nötig sind.
Der Benchmark enthält 129 Aufgaben aus den Bereichen Genomik, quantitative Biologie und translationale Medizin.
OpenAIs stärkstes Modell, GPT-5.6 Sol, löste 28,7 % der Probleme auf seinem höchsten Begründungsniveau. Im Pro-Modus lag die Quote bei 31,5 %. Die frühere gestufte Einführung von GPT-5.6 erfolgte auf Wunsch aus Washington.
GPT-5 erreichte beim ursprünglichen GeneBench weniger als 5 %, während Anthropics Opus 4.8 beim schwierigeren Test 16 % schaffte.
Folgen Sie uns auf X, um stets die aktuellsten Nachrichten zu erhalten
Zwei Strategien, ein Wettbewerb
Die unterschiedlichen Ansätze zeigen zwei Wege zum gleichen Ziel. Anthropic stellt ein Produkt für die tägliche Arbeit im Labor bereit. OpenAI misst, wie zuverlässig Modelle mit komplexen Daten umgehen können.
Beide Neuheiten erscheinen, während chinesische Modelle in der KI-Forschung aufholen. Die eigenen Zahlen von OpenAI relativieren den Hype, da ihr bestes Modell den Großteil der GeneBench-Pro-Aufgaben nicht lösen kann.
Der Druck ist geopolitisch und wissenschaftlich zugleich. US-Exportbeschränkungen haben Anthropic bereits dazu gebracht, neue Standorte für seine Modelle in Betracht zu ziehen.
Fachleute schätzen, dass eine Aufgabe von GeneBench-Pro bei einem menschlichen Experten 20 bis 40 Stunden dauert und Tausende USD kostet. OpenAI gibt an, dass sein Modell die Analyse für wenige USD abschließt.
Aubrey de Grey, ein biomedizinischer Gerontologe, sieht in KI die Möglichkeit, wichtige Engpässe in der Forschung zu beseitigen, auch wenn größere Fortschritte noch Zeit brauchen.
„Was wir sehr bald erleben werden, ist, dass KI bestimmte Teile des Prozesses, insbesondere die Entwicklung von Medikamenten, nicht mehr als Engpass erscheinen lässt”, sagte Aubrey de Grey, Präsident und Chief Science Officer der Longevity Escape Velocity Foundation, in einem Podcast von BeInCrypto.
De Grey warnte jedoch, dass die Umwandlung schneller Forschungsergebnisse in zugelassene Therapien weiterhin von Regulierung und der Akzeptanz von Risiken in der Bevölkerung abhängt.
Forscher erwarten schnellere Anwendung
Einige Experten meinen, das Umdenken finde bereits statt. Dr. Derya Unutmaz, Professor für Immunologie, sagte im gleichen BeInCrypto-Panel, dass KI inzwischen seine eigenen Einschätzungen übertrifft.
„Ich persönlich vertraue der KI mehr als meinen eigenen Ideen, obwohl ich seit 35 Jahren in meinem Fachgebiet tätig bin.”
Er erwartet, dass diese Abhängigkeit sich zügig auf die klinische Praxis ausweitet.
„Es ist unethisch und ich denke, sehr bald wird es als Kunstfehler gelten, in der Medizin keine KI zu nutzen.”
Dieser Optimismus geht den tatsächlichen Benchmark-Ergebnissen voraus. Die nächsten Monate werden zeigen, ob Wissenschaftler diese neuen Werkzeuge einsetzen, und ob die GeneBench-Pro-Resultate steigen.









