Zhipus neues Sprachmodell GLM 5.2 tritt mit einem Kontextfenster von einer Million Token an und soll vor allem beim Programmieren punkten. Die Gewichte kommen unter MIT-Lizenz, ein Seitenhieb auf die US-Exportschranken. Belastbare Benchmarks fehlen bislang.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenGLM 5.2 ist seit dem 13. Juni 2026 in allen Coding-Tarifen von Zhipus Z.ai verfügbar, die offenen Gewichte folgen kommende Woche. Für Entscheider zählt weniger die Schlagzeile als die Frage, was ein frei lizenziertes Spitzenmodell aus China praktisch verändert.
Das Wichtigste in Kürze
- Eine Million Token Kontext, Modell-ID glm-5.2[1m], bis zu 131.072 Token Ausgabe.
- Gewichte unter MIT-Lizenz, also frei selbst hostbar, Veröffentlichung in der Folgewoche angekündigt.
- Benchmarks fehlen zum Start, die Leistungsversprechen sind bislang reine Herstellerangaben.
Was steckt in GLM 5.2?

GLM 5.2 ist ein auf Programmieren ausgelegtes Sprachmodell mit einer Million Token Kontext und MIT-lizenzierten Gewichten. Der eigentliche Bruch liegt nicht in der Größe, sondern in der freien Lizenz: Unternehmen dürfen das Modell selbst betreiben und anpassen.
Reichweite mit Vorbehalt. Das riesige Kontextfenster soll Refactorings über ganze Code-Repositorys ermöglichen. In der Praxis bleibt aber zu prüfen, wie zuverlässig das Modell Informationen tief im Kontext noch findet, denn genau dort schwächeln große Fenster oft.
Muster. Mit der offenen Lizenz reiht sich GLM 5.2 in eine Reihe chinesischer Labs ein, die ihre Modelle als Antwort auf die US-Exportschranken freigeben. Laut Anbieter ist das Modell stark bei langen Aufgaben, nachprüfen lässt sich das ohne veröffentlichte Benchmarks vorerst nicht.
Lohnt sich das für deutsche Unternehmen?

Für Mittelständler mit Datenschutz-Auflagen ist die MIT-Lizenz der eigentliche Gewinn: Ein selbst gehostetes Modell verlässt das eigene Rechenzentrum nicht und entschärft so DSGVO-Fragen. Die fehlenden Benchmarks mahnen aber zur eigenen Prüfung vor dem Produktiveinsatz.
Souveränität. Wer Quellcode oder Kundendaten nicht in eine fremde Cloud geben will, gewinnt mit offenen Gewichten Spielraum. Der Betrieb braucht jedoch eigene GPU-Leistung, und auch unter dem EU AI Act bleibt die Transparenzpflicht beim Betreiber. Eine nüchterne Einordnung liefert der LLM-Ratgeber.
Kostenfalle. Lange Kontexte und Agenten treiben den Verbrauch, das zeigt die Token-Krise im Mittelstand. Wer GLM 5.2 in Werkzeugen wie Claude Code testet, sollte das Budget von Anfang an im Blick behalten.
Ein frei lizenziertes Spitzenmodell aus China ist für den deutschen Mittelstand keine Bedrohung, sondern eine Option für mehr Datensouveränität. Wer es nutzt, prüft die Leistung aber zuerst am eigenen Code.
— Markus Seyfferth, Chefredakteur Dr. Web
Starten Sie mit einem unkritischen Repository als Pilot und messen Sie Qualität und Kosten, bevor GLM 5.2 in den Produktivbetrieb wandert. So trennen Sie das Lizenzversprechen von der tatsächlichen Leistung.