LongCat-2.0 stellt die Annahme infrage, dass Spitzenmodelle Nvidia-Hardware brauchen. Der chinesische Lieferdienst Meituan trainierte das 1,6-Billionen-Modell komplett auf alternativen Beschleunigern. Unter MIT-Lizenz steht der agentische Coder jetzt frei zur Verfügung.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

LongCat-2.0 ist ein offenes Sprachmodell mit 1,6 Billionen Parametern, das Meituan heute auf GitHub und Hugging Face veröffentlicht hat. Hinter dem Modell stand monatelang ein anonymer Testkandidat namens Owl Alpha, der auf der Plattform OpenRouter zu den meistgenutzten Coding-Agenten aufstieg, wie der offizielle Blogeintrag ausführt.

Das Wichtigste in Kürze

  • LongCat-2.0 nutzt eine Mixture-of-Experts-Architektur mit 1,6 Billionen Parametern, von denen pro Token nur rund 48 Milliarden rechnen.
  • Training und Betrieb liefen vollständig auf alternativen KI-Beschleunigern, nicht auf Nvidia-Grafikkarten.
  • Die MIT-Lizenz erlaubt den kommerziellen Einsatz samt Einbau in geschlossene Produkte ohne Offenlegungspflicht.
  • Ein natives Kontextfenster von einer Million Token zielt auf lange Coding- und Agentenaufgaben.

Warum ist das Training ohne Nvidia bemerkenswert?

Blaue Keramikkatzenfigur mit Halsband und Plakette vor weißem Hintergrund
Training über 35 Billionen Token auf chinesischen KI-ASICs ohne Ausfälle zeigt Machbarkeit von Frontier-KI-Entwicklung außerhalb von Nvidia

Hardware-Souveränität. Der gesamte Trainingslauf über mehr als 35 Billionen Token lief auf spezialisierten KI-ASICs, laut Beobachtern auf heimischen Beschleunigern aus China. Meituan berichtet von einem Durchlauf ohne Abstürze und ohne unwiederbringliche Ausreißer, ein Beleg, dass Frontier-Training auch abseits der Nvidia-Welt gelingt. Für einen Markt unter Exportauflagen verschiebt dieser Befund die Gewichte spürbar.

Was leistet das Modell für Entwickler?

Transformator mit grünen Rohren, „1,6 TB Parameter“-Schild und Cartoon-Drache
LongCat-2.0 nutzt effiziente Aufmerksamkeit für agentengesteuerte Codierung mit bis zu einer Million Token Kontext und verarbeitet über zehn Billionen Token monatlich

Agenten-Coder. LongCat-2.0 ist von Grund auf für agentisches Arbeiten gebaut, also für Werkzeugaufrufe, mehrstufiges Schließen und lange Aufgabenketten. Als anonymer Testkandidat erreichte das Modell auf OpenRouter Platz zwei bei der Nutzung in Claude Code und über zehn Billionen Token im Monat. Eine eigene, sparsame Aufmerksamkeit hält das Tempo auch bei einer Million Token Kontext.

Ein Spitzenmodell ohne eine einzige Nvidia-Karte zu trainieren, war bis vor Kurzem undenkbar. Für deutsche Entscheider zählt weniger die Herkunft als die schlichte Tatsache, dass offene Gewichte die Abhängigkeit von einem einzelnen Zulieferer brechen.

— Markus Seyfferth, Chefredakteur Dr. Web

Was heißt das für den Mittelstand?

Oranger Container mit deutschem Text „1,6 BILLIONEN PARAMETER DATEN-KOLOSS“ und Katze auf Leiter vor weißem Hintergrund
MIT-Lizenz ermöglicht kostenlose Nutzung auf eigener Hardware ohne Offenlegung. Cache-Treffer im kommerziellen Tarif gratis

Kostenrechnung. Die freie MIT-Lizenz lässt Unternehmen das Modell auf eigener Hardware betreiben, anpassen und in Produkte gießen, ohne Quellcode offenlegen zu müssen. Cache-Treffer rechnet der Anbieter im kommerziellen Tarif kostenlos ab. Welche offenen Alternativen sonst infrage kommen, ordnet der LLM-Ratgeber ein, und wie weit chinesische Modelle aufgeholt haben, zeigt der Blick auf GLM-5.2.

Wie sollten Entscheider vorgehen?

Pallette mit rot-weißen Klemmbausteinen und einer kleinen grünen Spielzeugrakete darauf vor weißem Hintergrund
Modell von Hugging Face vor Beschaffung testen. Hardware-Kompatibilität und Stromkosten prüfen, nicht nur Token-Preise kalkulieren

Prüfen. Das Modell lädt jeder über Hugging Face herunter und prüft den Coder an einer eigenen Aufgabe, bevor eine Beschaffungsentscheidung fällt. Eine 1,6-Billionen-Maschine ist dabei wie ein Sattelschlepper: beeindruckend, aber nur sinnvoll, wenn die Strecke zur Ladung passt. Klären Sie zuerst, ob die eigene Hardware den Betrieb trägt, und kalkulieren Sie mit Stromkosten statt mit Token-Preisen.

Mehr Newshunger?

4,4 15 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?