LongCat-2.0 stellt die Annahme infrage, dass Spitzenmodelle Nvidia-Hardware brauchen. Der chinesische Lieferdienst Meituan trainierte das 1,6-Billionen-Modell komplett auf alternativen Beschleunigern. Unter MIT-Lizenz steht der agentische Coder jetzt frei zur Verfügung.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenLongCat-2.0 ist ein offenes Sprachmodell mit 1,6 Billionen Parametern, das Meituan heute auf GitHub und Hugging Face veröffentlicht hat. Hinter dem Modell stand monatelang ein anonymer Testkandidat namens Owl Alpha, der auf der Plattform OpenRouter zu den meistgenutzten Coding-Agenten aufstieg, wie der offizielle Blogeintrag ausführt.
Das Wichtigste in Kürze
- LongCat-2.0 nutzt eine Mixture-of-Experts-Architektur mit 1,6 Billionen Parametern, von denen pro Token nur rund 48 Milliarden rechnen.
- Training und Betrieb liefen vollständig auf alternativen KI-Beschleunigern, nicht auf Nvidia-Grafikkarten.
- Die MIT-Lizenz erlaubt den kommerziellen Einsatz samt Einbau in geschlossene Produkte ohne Offenlegungspflicht.
- Ein natives Kontextfenster von einer Million Token zielt auf lange Coding- und Agentenaufgaben.
Warum ist das Training ohne Nvidia bemerkenswert?

Hardware-Souveränität. Der gesamte Trainingslauf über mehr als 35 Billionen Token lief auf spezialisierten KI-ASICs, laut Beobachtern auf heimischen Beschleunigern aus China. Meituan berichtet von einem Durchlauf ohne Abstürze und ohne unwiederbringliche Ausreißer, ein Beleg, dass Frontier-Training auch abseits der Nvidia-Welt gelingt. Für einen Markt unter Exportauflagen verschiebt dieser Befund die Gewichte spürbar.
Was leistet das Modell für Entwickler?

Agenten-Coder. LongCat-2.0 ist von Grund auf für agentisches Arbeiten gebaut, also für Werkzeugaufrufe, mehrstufiges Schließen und lange Aufgabenketten. Als anonymer Testkandidat erreichte das Modell auf OpenRouter Platz zwei bei der Nutzung in Claude Code und über zehn Billionen Token im Monat. Eine eigene, sparsame Aufmerksamkeit hält das Tempo auch bei einer Million Token Kontext.
Ein Spitzenmodell ohne eine einzige Nvidia-Karte zu trainieren, war bis vor Kurzem undenkbar. Für deutsche Entscheider zählt weniger die Herkunft als die schlichte Tatsache, dass offene Gewichte die Abhängigkeit von einem einzelnen Zulieferer brechen.
— Markus Seyfferth, Chefredakteur Dr. Web
Was heißt das für den Mittelstand?

Kostenrechnung. Die freie MIT-Lizenz lässt Unternehmen das Modell auf eigener Hardware betreiben, anpassen und in Produkte gießen, ohne Quellcode offenlegen zu müssen. Cache-Treffer rechnet der Anbieter im kommerziellen Tarif kostenlos ab. Welche offenen Alternativen sonst infrage kommen, ordnet der LLM-Ratgeber ein, und wie weit chinesische Modelle aufgeholt haben, zeigt der Blick auf GLM-5.2.
Wie sollten Entscheider vorgehen?

Prüfen. Das Modell lädt jeder über Hugging Face herunter und prüft den Coder an einer eigenen Aufgabe, bevor eine Beschaffungsentscheidung fällt. Eine 1,6-Billionen-Maschine ist dabei wie ein Sattelschlepper: beeindruckend, aber nur sinnvoll, wenn die Strecke zur Ladung passt. Klären Sie zuerst, ob die eigene Hardware den Betrieb trägt, und kalkulieren Sie mit Stromkosten statt mit Token-Preisen.