Qwen heißt die KI-Familie aus dem Hause Alibaba, und in deutschen Unternehmen taucht der Name immer häufiger auf. Über eine Milliarde Downloads stehen zu Buche, die Modelle belegen Spitzenplätze in den Ranglisten, und das meiste davon bleibt kostenlos. Die spannende Frage lautet nicht, ob Qwen etwas kann, sondern was davon in einen DSGVO-Alltag passt.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenViele Entscheider kennen ChatGPT und Claude, zahlen brav ihre Lizenzgebühren und fragen sich trotzdem, wohin die eingetippten Geschäftsdaten eigentlich abfließen. Genau an diesem Punkt wird Qwen interessant. Die Modelle laufen nicht nur in der Cloud, sondern bei Bedarf komplett auf dem eigenen Server, ohne dass ein einziges Wort das Firmennetz verlässt.
Das Wichtigste in Kürze
- Qwen ist die Open-Source-KI-Familie von Alibaba Cloud, gestartet 2023 und heute eine der meistgenutzten offenen Modellreihen der Welt.
- Die meisten Modelle stehen unter der Apache-2.0-Lizenz frei zur Verfügung und laufen vom Smartphone bis zum Rechenzentrum.
- Für deutsche Unternehmen zählt vor allem die Datensouveränität: Im lokalen Betrieb verlässt kein Datensatz das Netzwerk, alternativ bietet Alibaba eine Cloud-Region in Frankfurt.
- Das offene Flaggschiff Qwen3.5 spielt in der Liga von GPT und Claude, die Cloud-Preise liegen je nach Modell im Cent-Bereich pro Million Token.
Was ist Qwen und wer steckt dahinter?

Qwen ist die Familie großer Sprachmodelle von Alibaba Cloud, der Cloud-Sparte des chinesischen Handelskonzerns Alibaba. Der offizielle Name lautet Tongyi Qianwen, auf Deutsch ungefähr „tausend Fragen“, im Westen kurz Qwen und gesprochen wie „tschwen“. Seit dem Beta-Start im April 2023 hat sich aus einem einzelnen Chatmodell eine ganze Produktreihe für Text, Code, Bilder, Audio und Video entwickelt.
Die Reihe ist schnell groß geworden. Nach Angaben von Alibaba Cloud und Berichten von CNBC gehört Qwen heute zu den meistgenutzten offenen Modellfamilien weltweit, mit nach Branchenzählungen rund einer Milliarde Downloads und mehr als hunderttausend abgeleiteten Modellen. Die Verbraucher-App rangiert nach diesen Zählungen global auf Platz drei, hinter ChatGPT und dem ebenfalls chinesischen DouBao.
Hinter dem Tempo steckt eine klare Geschäftslogik. Alibaba verdient nicht an Modell-Lizenzen, sondern an Cloud-Rechenleistung. Je mehr Entwickler die offenen Modelle einsetzen, desto mehr Umsatz fließt über API und Infrastruktur zurück. Diese Rechnung erklärt, warum ein Milliardenkonzern sein bestes offenes Modell verschenkt.
Eine Einordnung der vielen Fachbegriffe rund um Sprachmodelle liefert unser großes KI-Glossar für Entscheider. Die Grundlagen dort helfen, die folgenden Modellnamen einzusortieren.
Welche Qwen-Modelle gibt es 2026?

Die Modellpalette gleicht weniger einem einzelnen Werkzeug als einem ganzen Werkzeugkasten, vom Taschenmesser für das Smartphone bis zur Standbohrmaschine fürs Rechenzentrum. Genau diese Breite unterscheidet Qwen von Konkurrenten, die nur ein oder zwei Größen anbieten.
Das aktuelle offene Flaggschiff trägt den Namen Qwen3.5 und ist nach Bericht von CNBC am Vorabend des chinesischen Neujahrsfests im Februar 2026 erschienen. Die größte Variante bringt 397 Milliarden Parameter mit, von denen je Anfrage nur 17 Milliarden aktiv rechnen, und versteht 201 Sprachen und Dialekte. Daneben hat Alibaba im Mai 2026 mit Qwen3.7-Max ein proprietäres Spitzenmodell angekündigt, das ausschließlich über die API läuft und auf lange, selbstständige Aufgaben zielt.
| Modell | Typ | Wofür gedacht |
|---|---|---|
| Qwen3.5-0.8B / 2B | Dense, offen | Smartphones und Edge-Geräte |
| Qwen3.5-4B / 9B | Dense, offen | Laptops und leichte Agenten |
| Qwen3.5-397B-A17B | MoE, offen | Flaggschiff fürs Rechenzentrum |
| Qwen3-Coder 480B-A35B | MoE, offen | Programmierung |
| Qwen3.7-Max | proprietär, nur API | Agenten und lange Aufgaben |
| Qwen-VL / Omni / Image | multimodal | Bild, Audio und Video |
Auffällig ist die untere Kante der Palette. Das Linux-Magazin hat dokumentiert, dass das kompakte Modell Qwen3.5-9B in mehreren unabhängigen Tests das rund dreizehnmal größere offene Modell GPT-OSS-120B von OpenAI übertrifft. Die kleinsten Modelle mit 0,8 und 2 Milliarden Parametern laufen sogar auf dem Smartphone.
Inzwischen reicht die Reihe über das Chatfenster hinaus. Mit der Qwen-Robot Suite ist Alibaba im Juni 2026 in die Robotik vorgestoßen, ein Schritt, den wir in einem eigenen Beitrag eingeordnet haben. Die Hintergründe dazu liefert unsere Analyse zu Qwens Vorstoß in die Robotik.
Was kann Qwen wirklich?

Im Kern beherrscht Qwen das, was man von einem modernen Sprachmodell erwartet: Texte schreiben, zusammenfassen, übersetzen, Code erzeugen und strukturierte Daten auswerten. Spannender für den Arbeitsalltag sind die Zusatzfähigkeiten, die in den letzten Generationen dazugekommen sind.
Zwei davon ragen heraus. Die neueren Modelle schalten zwischen einem Thinking-Modus für knifflige Aufgaben und einem schnellen Modus für einfache Antworten um, sodass sich Tempo und Kosten steuern lassen. Dazu unterstützt Qwen3 das Model Context Protocol und kann damit auf Werkzeuge, Datenbanken und externe Dienste zugreifen, eine Voraussetzung für Agenten, die mehr tun als nur reden.
Auch beim Sprachumfang liefert die Reihe. Alibaba Cloud nennt für Qwen3 über 119 Sprachen, für Qwen3.5 sogar 201, und Deutsch gehört selbstverständlich dazu. Längere Dokumente sind kein Problem, denn die Cloud-Modelle Qwen3.5-Plus und Qwen3.5-Flash arbeiten mit einem Kontextfenster von bis zu einer Million Token, genug für einen kompletten Geschäftsbericht in einer einzigen Anfrage.
Was kostet Qwen im Einsatz?

Beim Preis trennt Qwen zwei Welten sauber voneinander. Die offenen Modelle kosten in der Lizenz nichts, weil die Apache-2.0-Lizenz die kommerzielle Nutzung erlaubt. Wer selbst hostet, zahlt nur Hardware und Strom, dafür fällt keine Gebühr pro Anfrage an.
Die zweite Welt ist die Cloud über das Alibaba Cloud Model Studio. Die folgenden Preise stammen aus dem offiziellen Tarif für die Frankfurt-Region und sind zum Referenzkurs der Europäischen Zentralbank vom 19. Juni 2026 in Euro umgerechnet. Schon der Blick auf die Zahlen zeigt, wie tief der Cent-Bereich hier liegt.
| Modell (Frankfurt-Tarif) | Eingabe je 1 Mio. Token | Ausgabe je 1 Mio. Token |
|---|---|---|
| Qwen3.5-Flash | 0,03 € | 0,25 € |
| Qwen3.5-Plus | 0,10 € | 0,60 € |
| Qwen3-Max | 0,31 € | 1,25 € |
Diese Preise unterbieten die westlichen Spitzenmodelle um ein Vielfaches, deren Ausgabe-Token je nach Anbieter ein Mehrfaches kosten. Den Hebel sollte trotzdem niemand überschätzen: Ein rohes Sprachmodell löst noch kein Geschäftsproblem, und die wahren Kosten stecken oft in Integration, Pflege und Personal, nicht im Token-Preis. Zum Ausprobieren stellt Alibaba neuen Konten ein kostenloses Startkontingent an Token bereit.
Wie setzen Sie Qwen praktisch ein?

Für den Einstieg führen vier Wege zum Ziel, je nach technischem Anspruch. Der schnellste läuft über Qwen Chat unter qwen.ai, eine kostenlose Oberfläche im Stil von ChatGPT, mit Chat, Bildverständnis, Bildgenerierung und Dokumentenanalyse.
Wer Qwen in eigene Anwendungen einbauen will, nutzt die API über das Model Studio. Entwickler, die volle Kontrolle brauchen, laden die offenen Gewichte über Hugging Face oder die Alibaba-Plattform ModelScope und betreiben das Modell selbst. Für genau diesen lokalen Weg hat sich eine simple Kombination etabliert.
Diese Kombination heißt LM Studio oder Ollama plus ein passendes Qwen-Modell. Beide Programme sind in wenigen Minuten installiert, danach läuft Qwen3 auf einem besseren Laptop oder einem internen Server, auch offline. Eingaben, Dokumente und Protokolle bleiben dabei vollständig im eigenen Haus.
Ist Qwen DSGVO-konform einsetzbar?

Hier liegt die eigentliche Entscheidung für deutsche Unternehmen, und die Antwort hängt komplett am Betriebsweg. Die chinesische Cloud-Variante ist datenschutzrechtlich heikel, der lokale Betrieb dagegen entspannt.
Der Grund steckt in Kapitel V der DSGVO. Personenbezogene Daten dürfen nur dann in ein Land außerhalb der EU fließen, sofern dort ein vergleichbares Schutzniveau herrscht. China gilt nicht als sicheres Drittland, und ein im Juni 2026 von Euronews dokumentiertes Gesetz stuft Algorithmen und Daten in China ausdrücklich als schützenswerte Staatsangelegenheit ein. Daten auf chinesischen Servern können also unter Umständen für Behörden zugänglich sein.
Für die offizielle Cloud gibt es einen Mittelweg, den Alibaba selbst anbietet. Im Global-Deployment lassen sich Endpunkt und Datenspeicher auf die Region Frankfurt legen, die Daten bleiben damit physisch in Deutschland. Restzweifel bleiben dennoch, weil der Mutterkonzern chinesischem Recht unterliegt.
Qwen dreht die übliche Cloud-Logik um. Das offene Neun-Milliarden-Modell läuft lokal auf dem Firmenserver, und damit löst sich die China-Datenschutzfrage nicht über Verträge, sondern weil kein einziger Prompt das Haus verlässt.
— Michael Dobler, Herausgeber Dr. Web
Die sauberste Lösung bleibt deshalb der lokale Betrieb der offenen Modelle. Sobald Qwen3 auf dem eigenen Server rechnet, entfällt der Drittstaatentransfer komplett, und die Datensouveränität liegt zu hundert Prozent im Haus. Und falls die Aufsichtsbehörde morgen anfragt, wohin die Prompts gelaufen sind? Die ehrliche Antwort lautet dann nirgendwohin.
🎬 Videoplatzhalter
Suchbegriff für YouTube: chinesische KI DSGVO Datenschutz Unternehmen
Gewünschter Inhalt: Rechtliche Einordnung zum Einsatz chinesischer KI-Dienste in der EU
Bevorzugte Quellen: eRecht24, Datenschutz-Behörden, Fachanwälte für IT-Recht
Wie schlägt sich Qwen gegen ChatGPT, Claude und DeepSeek?

Im direkten Vergleich spielt Qwen in zwei Ligen mit. Gegen die geschlossenen Spitzenmodelle aus den USA tritt das proprietäre Qwen3.7-Max an, im offenen Lager misst sich die Reihe vor allem mit DeepSeek, Meta und Mistral.
| Anbieter | Herkunft | Offene Gewichte | Lokal betreibbar |
|---|---|---|---|
| Qwen (Alibaba) | China | ja, Apache 2.0 | ja |
| ChatGPT (OpenAI) | USA | nein | nein |
| Claude (Anthropic) | USA | nein | nein |
| Gemini (Google) | USA | nein | nein |
| DeepSeek | China | ja | ja |
| Mistral | Frankreich | teils | ja |
Gegen DeepSeek, den anderen großen chinesischen Namen, punktet Qwen vor allem mit der Breite der Modellpalette, die von winzigen Edge-Modellen bis zum Coder reicht. Wer den klassischen Platzhirsch von OpenAI im Detail kennenlernen will, findet die Einordnung in unserem Beitrag zu GPT-4 und seinen Nachfolgern. Unsere nüchterne Einschätzung: Bei reiner Spitzenleistung führen die geschlossenen US-Modelle weiterhin knapp, beim Verhältnis aus Leistung, Preis und Datenkontrolle hat Qwen jedoch die Nase vorn.
Für wen lohnt sich Qwen, für wen nicht?

Eine pauschale Empfehlung wäre unehrlich, denn die Entscheidung hängt an Ihrer Ausgangslage. Klar fällt die Wahl in zwei Richtungen aus.
Für Sie spricht Qwen, sofern Datensouveränität ein hartes Kriterium ist, das Budget auf Token-Kosten reagiert oder ohnehin ein technisches Team im Haus steht. Ein Mittelständler, der Verträge und interne Memos durch eine KI verdichten lassen will, betreibt Qwen3 lokal und gibt dabei keine Zeile nach außen. Gegen Qwen spricht die Lage, sobald eine schlüsselfertige Lösung ohne eigene IT gefragt ist oder niemand die Infrastruktur betreuen kann.
Unterm Strich ist Qwen kein Wundermittel und kein Grund zur Panik, sondern ein erstaunlich vielseitiges Werkzeug. Die richtige Frage für Ihr Unternehmen lautet nicht ChatGPT oder Qwen, sondern Cloud oder eigener Server. Wer diese Weiche bewusst stellt, hat den wichtigsten Teil der Entscheidung schon getroffen.
Glossar: 17 wichtige Fachbegriffe zu Qwen

Apache-2.0-Lizenz
Apache-2.0-Lizenz: Eine freizügige Open-Source-Lizenz, die das Nutzen, Verändern und kommerzielle Weitergeben von Software erlaubt. Die meisten offenen Qwen-Modelle stehen unter dieser Lizenz, weshalb Unternehmen die Modelle ohne Gebühren produktiv einsetzen dürfen.
DashScope (Model Studio)
DashScope (Model Studio): Die Cloud-Plattform von Alibaba für den API-Zugriff auf Qwen-Modelle, im internationalen Auftritt als Model Studio bekannt. Über diese Plattform laufen Abrechnung, Modellauswahl und die Wahl der Datenregion.
Datensouveränität
Datensouveränität: Die vollständige Kontrolle eines Unternehmens darüber, wo die eigenen Daten gespeichert und verarbeitet werden. Im lokalen Betrieb von Qwen bleibt diese Kontrolle zu hundert Prozent im eigenen Netzwerk.
Dense-Modell
Dense-Modell: Ein Sprachmodell, bei dem für jede Anfrage alle Parameter rechnen. Im Gegensatz zum MoE-Ansatz sind solche Modelle einfacher zu betreiben, brauchen aber bei gleicher Größe mehr Rechenleistung.
Drittstaatentransfer
Drittstaatentransfer: Die Übermittlung personenbezogener Daten in ein Land außerhalb der EU. Nach Kapitel V der DSGVO ist dieser Transfer nur unter strengen Bedingungen zulässig, was den Einsatz chinesischer Cloud-KI rechtlich erschwert.
Fine-Tuning
Fine-Tuning: Die Nachschulung eines vortrainierten Modells mit eigenen Daten für einen konkreten Anwendungsfall. Offene Qwen-Modelle lassen sich auf diese Weise an Branche oder Unternehmen anpassen.
Hugging Face
Hugging Face: Eine internationale Plattform, über die Entwickler offene KI-Modelle samt Gewichten herunterladen und teilen. Qwen-Modelle gehören dort zu den am häufigsten bezogenen Reihen.
Kontextfenster
Kontextfenster: Die Menge an Text, die ein Modell in einer einzigen Anfrage verarbeiten kann, gemessen in Token. Qwen3.5-Plus erreicht bis zu eine Million Token, genug für sehr lange Dokumente.
Large Language Model (LLM)
Large Language Model (LLM): Ein großes Sprachmodell, das aus riesigen Textmengen statistische Muster gelernt hat und daraus neue Texte erzeugt. Qwen ist eine ganze Familie solcher Modelle.
Mixture of Experts (MoE)
Mixture of Experts (MoE): Eine Architektur, bei der nur ein Teil der Parameter je Anfrage aktiv wird. Qwen3.5 nutzt diesen Ansatz, um bei 397 Milliarden Parametern nur 17 Milliarden gleichzeitig rechnen zu lassen.
Model Context Protocol (MCP)
Model Context Protocol (MCP): Ein offener Standard, über den ein Sprachmodell auf externe Werkzeuge, Datenbanken und Dienste zugreift. Qwen3 unterstützt dieses Protokoll und eignet sich damit als Agenten-Backend.
Multimodalität
Multimodalität: Die Fähigkeit eines Modells, mehrere Datenarten zugleich zu verstehen, etwa Text, Bild, Audio und Video. Die Qwen-VL- und Omni-Reihe bringt diese Fähigkeit mit.
Ollama
Ollama: Ein kostenloses Programm, mit dem sich offene Sprachmodelle auf dem eigenen Rechner betreiben lassen. Über Ollama läuft Qwen3 lokal, ohne Anbindung an eine Cloud.
Open Weights
Open Weights: Frei verfügbare Modellgewichte, die jeder herunterladen und selbst betreiben kann. Bei Qwen bilden die offenen Gewichte die Grundlage für den DSGVO-freundlichen lokalen Betrieb.
Thinking-Modus
Thinking-Modus: Ein Betriebsmodus, in dem das Modell vor der Antwort einen mehrschrittigen Gedankengang durchläuft. Qwen schaltet zwischen diesem Modus und einem schnellen Modus um, um Tempo und Kosten zu steuern.
Token
Token: Die kleinste Recheneinheit für Text, grob ein Wortteil. Die Cloud-Preise von Qwen rechnen je Million Token ab, getrennt nach Eingabe und Ausgabe.
Tongyi Qianwen
Tongyi Qianwen: Der vollständige chinesische Name von Qwen, übersetzt ungefähr „tausend Fragen“. Die Kurzform Qwen hat sich im westlichen Sprachgebrauch durchgesetzt.
FAQ: Was Alibabas KI Qwen für Ihr Unternehmen kann

Was ist Qwen?
Qwen ist die Familie großer Sprach- und Multimodal-Modelle von Alibaba Cloud, der vollständige Name lautet Tongyi Qianwen. Die Reihe umfasst offene Modelle vom Smartphone-Format bis zum Rechenzentrum sowie ein proprietäres Spitzenmodell und zählt zu den meistgenutzten KI-Modellfamilien weltweit.
Ist Qwen kostenlos nutzbar?
Die offenen Qwen-Modelle unter der Apache-2.0-Lizenz sind kostenlos und auch kommerziell frei verwendbar, lediglich Hardware und Strom verursachen Kosten. Die kostenlose Oberfläche Qwen Chat steht ebenfalls bereit, während der API-Zugang über die Cloud nach Token abgerechnet wird.
Ist Qwen DSGVO-konform einsetzbar?
Im lokalen Betrieb ja, denn dann verlässt kein Datensatz das eigene Netzwerk und der Drittstaatentransfer entfällt. Die chinesische Cloud-Variante ist dagegen kritisch, die EU-Region Frankfurt bildet einen Mittelweg mit verbleibenden rechtlichen Restzweifeln.
Kann Qwen Deutsch?
Ja, Deutsch gehört zum Sprachumfang. Alibaba Cloud nennt für Qwen3 über 119 Sprachen und für Qwen3.5 sogar 201 Sprachen und Dialekte, deutsche Texte versteht und erzeugt die Reihe entsprechend zuverlässig.
Wie betreiben Sie Qwen lokal im Unternehmen?
Über ein kostenloses Programm wie LM Studio oder Ollama laden Sie ein passendes Qwen-Modell herunter und starten das Modell auf einem leistungsfähigen Laptop oder einem internen Server. Die kleineren Modelle laufen bereits auf Standard-Hardware, größere brauchen entsprechend mehr Speicher.
Was ist besser, Qwen oder ChatGPT?
Bei reiner Spitzenleistung führen die geschlossenen US-Modelle weiterhin knapp. Beim Verhältnis aus Leistung, Preis und Datenkontrolle hat Qwen die Nase vorn, vor allem weil sich die offenen Modelle DSGVO-freundlich lokal betreiben lassen.
Quellen
Alibaba Cloud | Model list, Model Studio | https://www.alibabacloud.com/help/en/model-studio/models | besucht am 22.06.2026
Alibaba Cloud | Qwen, Generative AI Solutions | https://www.alibabacloud.com/en/solutions/generative-ai/qwen | besucht am 22.06.2026
CNBC | Alibaba unveils Qwen3.5 as China’s chatbot race shifts to AI agents | https://www.cnbc.com/2026/02/17/china-alibaba-qwen-ai-agent-latest-model.html | besucht am 22.06.2026
South China Morning Post | Alibaba unveils new Qwen model, custom chips in bid to become China’s AI factory | https://www.scmp.com/tech/big-tech/article/3354212/alibaba-unveils-new-qwen-model-custom-chips-bid-become-chinas-ai-factory | besucht am 22.06.2026
Linux-Magazin | Alibaba launcht neue KI-Modelle der Open-Source-Familie Qwen | https://www.linux-magazin.de/news/alibaba-launcht-neue-ki-modelle-der-open-source-familie-qwen/ | besucht am 22.06.2026
Euronews | Neue Regeln zum Geschäftsgeheimnis: China erklärt KI-Daten zur Privatsache | https://de.euronews.com/next/2026/06/02/neue-regeln-zum-geschaftsgeheimnis-china-erklart-ki-daten-zur-privatsache | besucht am 22.06.2026
Europäische Zentralbank | Euro-Referenzkurs US-Dollar | https://www.ecb.europa.eu/stats/policy_and_exchange_rates/euro_reference_exchange_rates/html/eurofxref-graph-usd.en.html | besucht am 22.06.2026
]]>