Anthropic hat Claude Opus 4.8 veröffentlicht und nur 41 Tage nach Opus 4.7, einem deutlich kürzeren Zyklus als üblich. Das Modell bringt Dynamic Workflows für parallele Agenten-Schwärme und einen neuen Fokus, der in der KI-Welt noch selten explizit adressiert wird: Ehrlichkeit gegenüber eigenen Fehlern.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenDas Wichtigste in Kürze
- Claude Opus 4.8 ist viermal weniger wahrscheinlich als 4.7, eigene Code-Fehler unkommentiert durchzulassen
- Dynamic Workflows (Research Preview): Claude Code kann Hunderte parallele Subagenten in einer Session koordinieren
- Fast Mode kostet ein Drittel des bisherigen Preises – High-Throughput-Inference für Produktivsysteme wird zugänglich
- Preise bleiben unverändert: 5 Dollar pro Million Input-Token, 25 Dollar Output
- Mythos-Modelle für alle Kunden in den „nächsten Wochen“ angekündigt
Was steckt hinter dem Ehrlichkeits-Fokus?
Ein generelles Problem bei KI-Modellen: Sie tendieren dazu, Fortschritt zu behaupten, auch wenn die Evidenz dünn ist. Anthropic bezeichnet das in der Modellkarte zu Opus 4.8 als eines der zentralen Evaluierungskriterien. In internen Tests war Opus 4.8 viermal seltener als Opus 4.7 dabei erwischt worden, Fehler im selbst geschriebenen Code durchzulassen, ohne sie zu kommentieren. Unternehmen wie Cognition (Devin), Cursor und der Legal-AI-Anbieter Harvey haben das in eigenen Benchmarks bestätigt. Auf Harveys Legal Agent Benchmark erzielte Opus 4.8 laut Anthropic den bisher höchsten gemessenen Score.
Die Dynamic-Workflows-Funktion ist zunächst als Research Preview verfügbar und ermöglicht in Claude Code die Planung und parallele Ausführung von Subagenten innerhalb einer einzigen Session. Anthropic nennt als Anwendungsfall Codebase-Migrationen über Hunderttausende Zeilen, von der Aufgabenverteilung bis zum Merge-Commit.
Warum 41 Tage nach Opus 4.7?
Der Rhythmus ist ungewöhnlich für Anthropic. Sonnet und Haiku sind drei respektive sieben Monate alt. Der beschleunigte Release-Zyklus dürfte mit dem gemischten Empfang von Opus 4.7 zusammenhängen, das einige Nutzer als Rückschritt gegenüber dem Cybersecurity-Preview Mythos wahrnahmen. Im selben Zeitraum veröffentlichte OpenAI GPT-5.4 mit Computer-Use und Google aktualisierte Gemini Flash. Der Wettbewerbsdruck war sichtbar.
Anthropic liefert mit Opus 4.8 das, was Enterprise-Teams von einem Frontier-Modell erwarten: vorhersehbares Verhalten, klare Fehlermeldungen und planbare Kosten.
Michael Dobler, Herausgeber von Dr. Web
Opus 4.8 ist ab sofort über die Claude API unter dem Bezeichner claude-opus-4-8 verfügbar, auf claude.ai sowie bei Amazon Bedrock, Google Vertex AI und Microsoft Foundry. Wie sich Anthropic in der aktuellen Wettbewerbssituation positioniert, zeigt die Übersicht Anthropic überholt OpenAI in der Bewertung. Den technischen Vergleich der aktuellen LLM-Generation liefert der LLMs-Ratgeber auf Dr. Web.