Qwen: Was Alibabas KI für Ihr Unternehmen kann

Qwen heißt die KI-Familie aus dem Hause Alibaba, und in deutschen Unternehmen taucht der Name immer häufiger auf. Über eine Milliarde Downloads stehen zu Buche, die Modelle belegen Spitzenplätze in den Ranglisten, und das meiste davon bleibt kostenlos. Die spannende Frage lautet nicht, ob Qwen etwas kann, sondern was davon in einen DSGVO-Alltag passt.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Viele Entscheider kennen ChatGPT und Claude, zahlen brav ihre Lizenzgebühren und fragen sich trotzdem, wohin die eingetippten Geschäftsdaten eigentlich abfließen. Genau an diesem Punkt wird Qwen interessant. Die Modelle laufen nicht nur in der Cloud, sondern bei Bedarf komplett auf dem eigenen Server, ohne dass ein einziges Wort das Firmennetz verlässt.

Das Wichtigste in Kürze

Qwen ist die Open-Source-KI-Familie von Alibaba Cloud, gestartet 2023 und heute eine der meistgenutzten offenen Modellreihen der Welt.
Die meisten Modelle stehen unter der Apache-2.0-Lizenz frei zur Verfügung und laufen vom Smartphone bis zum Rechenzentrum.
Für deutsche Unternehmen zählt vor allem die Datensouveränität: Im lokalen Betrieb verlässt kein Datensatz das Netzwerk, alternativ bietet Alibaba eine Cloud-Region in Frankfurt.
Das offene Flaggschiff Qwen3.5 spielt in der Liga von GPT und Claude, die Cloud-Preise liegen je nach Modell im Cent-Bereich pro Million Token.

Was ist Qwen und wer steckt dahinter?

Aufgebrochener Glückskeks mit Pinguin-Pin und Zettel, auf dem — Qwen ist Alibabas Familie großer Sprachmodelle. Seit April 2023 wuchs es von einem Chatmodell zu einer Produktreihe für Text, Code, Bilder, Audio und Video

Qwen ist die Familie großer Sprachmodelle von Alibaba Cloud, der Cloud-Sparte des chinesischen Handelskonzerns Alibaba. Der offizielle Name lautet Tongyi Qianwen, auf Deutsch ungefähr „tausend Fragen“, im Westen kurz Qwen und gesprochen wie „tschwen“. Seit dem Beta-Start im April 2023 hat sich aus einem einzelnen Chatmodell eine ganze Produktreihe für Text, Code, Bilder, Audio und Video entwickelt.

Die Reihe ist schnell groß geworden. Nach Angaben von Alibaba Cloud und Berichten von CNBC gehört Qwen heute zu den meistgenutzten offenen Modellfamilien weltweit, mit nach Branchenzählungen rund einer Milliarde Downloads und mehr als hunderttausend abgeleiteten Modellen. Die Verbraucher-App rangiert nach diesen Zählungen global auf Platz drei, hinter ChatGPT und dem ebenfalls chinesischen DouBao.

Hinter dem Tempo steckt eine klare Geschäftslogik. Alibaba verdient nicht an Modell-Lizenzen, sondern an Cloud-Rechenleistung. Je mehr Entwickler die offenen Modelle einsetzen, desto mehr Umsatz fließt über API und Infrastruktur zurück. Diese Rechnung erklärt, warum ein Milliardenkonzern sein bestes offenes Modell verschenkt.

Eine Einordnung der vielen Fachbegriffe rund um Sprachmodelle liefert unser großes KI-Glossar für Entscheider. Die Grundlagen dort helfen, die folgenden Modellnamen einzusortieren.

Welche Qwen-Modelle gibt es 2026?

Fünf Matrjoschkas in aufsteigender Größe mit Größen- und Zahlendaten, Megafon — Von 0,8 bis 397 Milliarden Parametern: Qwen deckt vom Smartphone bis zum Rechenzentrum jede Größe ab.

Die Modellpalette gleicht weniger einem einzelnen Werkzeug als einem ganzen Werkzeugkasten, vom Taschenmesser für das Smartphone bis zur Standbohrmaschine fürs Rechenzentrum. Genau diese Breite unterscheidet Qwen von Konkurrenten, die nur ein oder zwei Größen anbieten.

Das aktuelle offene Flaggschiff trägt den Namen Qwen3.5 und ist nach Bericht von CNBC am Vorabend des chinesischen Neujahrsfests im Februar 2026 erschienen. Die größte Variante bringt 397 Milliarden Parameter mit, von denen je Anfrage nur 17 Milliarden aktiv rechnen, und versteht 201 Sprachen und Dialekte. Daneben hat Alibaba im Mai 2026 mit Qwen3.7-Max ein proprietäres Spitzenmodell angekündigt, das ausschließlich über die API läuft und auf lange, selbstständige Aufgaben zielt.

Modell	Typ	Wofür gedacht
Qwen3.5-0.8B / 2B	Dense, offen	Smartphones und Edge-Geräte
Qwen3.5-4B / 9B	Dense, offen	Laptops und leichte Agenten
Qwen3.5-397B-A17B	MoE, offen	Flaggschiff fürs Rechenzentrum
Qwen3-Coder 480B-A35B	MoE, offen	Programmierung
Qwen3.7-Max	proprietär, nur API	Agenten und lange Aufgaben
Qwen-VL / Omni / Image	multimodal	Bild, Audio und Video

Auffällig ist die untere Kante der Palette. Das Linux-Magazin hat dokumentiert, dass das kompakte Modell Qwen3.5-9B in mehreren unabhängigen Tests das rund dreizehnmal größere offene Modell GPT-OSS-120B von OpenAI übertrifft. Die kleinsten Modelle mit 0,8 und 2 Milliarden Parametern laufen sogar auf dem Smartphone.

Inzwischen reicht die Reihe über das Chatfenster hinaus. Mit der Qwen-Robot Suite ist Alibaba im Juni 2026 in die Robotik vorgestoßen, ein Schritt, den wir in einem eigenen Beitrag eingeordnet haben. Die Hintergründe dazu liefert unsere Analyse zu Qwens Vorstoß in die Robotik.

Was kann Qwen wirklich?

Rotes Schweizer Taschenmesser mit Symbolen, Text und blauem Anhänger auf weißem Grund — Qwen3 versteht laut Alibaba Cloud über 119 Sprachen, Qwen3.5 sogar 201.

Im Kern beherrscht Qwen das, was man von einem modernen Sprachmodell erwartet: Texte schreiben, zusammenfassen, übersetzen, Code erzeugen und strukturierte Daten auswerten. Spannender für den Arbeitsalltag sind die Zusatzfähigkeiten, die in den letzten Generationen dazugekommen sind.

Zwei davon ragen heraus. Die neueren Modelle schalten zwischen einem Thinking-Modus für knifflige Aufgaben und einem schnellen Modus für einfache Antworten um, sodass sich Tempo und Kosten steuern lassen. Dazu unterstützt Qwen3 das Model Context Protocol und kann damit auf Werkzeuge, Datenbanken und externe Dienste zugreifen, eine Voraussetzung für Agenten, die mehr tun als nur reden.

Auch beim Sprachumfang liefert die Reihe. Alibaba Cloud nennt für Qwen3 über 119 Sprachen, für Qwen3.5 sogar 201, und Deutsch gehört selbstverständlich dazu. Längere Dokumente sind kein Problem, denn die Cloud-Modelle Qwen3.5-Plus und Qwen3.5-Flash arbeiten mit einem Kontextfenster von bis zu einer Million Token, genug für einen kompletten Geschäftsbericht in einer einzigen Anfrage.

Was kostet Qwen im Einsatz?

Mausfigur zwischen Streichpreis-Zettel und Etikettenrolle mit Preis 0,03€ — Im Frankfurter Cloud-Tarif kostet eine Million Token bei Qwen3.5-Flash rund drei Cent in der Eingabe.

Beim Preis trennt Qwen zwei Welten sauber voneinander. Die offenen Modelle kosten in der Lizenz nichts, weil die Apache-2.0-Lizenz die kommerzielle Nutzung erlaubt. Wer selbst hostet, zahlt nur Hardware und Strom, dafür fällt keine Gebühr pro Anfrage an.

Die zweite Welt ist die Cloud über das Alibaba Cloud Model Studio. Die folgenden Preise stammen aus dem offiziellen Tarif für die Frankfurt-Region und sind zum Referenzkurs der Europäischen Zentralbank vom 19. Juni 2026 in Euro umgerechnet. Schon der Blick auf die Zahlen zeigt, wie tief der Cent-Bereich hier liegt.

Modell (Frankfurt-Tarif)	Eingabe je 1 Mio. Token	Ausgabe je 1 Mio. Token
Qwen3.5-Flash	0,03 €	0,25 €
Qwen3.5-Plus	0,10 €	0,60 €
Qwen3-Max	0,31 €	1,25 €

Diese Preise unterbieten die westlichen Spitzenmodelle um ein Vielfaches, deren Ausgabe-Token je nach Anbieter ein Mehrfaches kosten. Den Hebel sollte trotzdem niemand überschätzen: Ein rohes Sprachmodell löst noch kein Geschäftsproblem, und die wahren Kosten stecken oft in Integration, Pflege und Personal, nicht im Token-Preis. Zum Ausprobieren stellt Alibaba neuen Konten ein kostenloses Startkontingent an Token bereit.

Wie setzen Sie Qwen praktisch ein?

Ein silberner Server-Würfel mit Schneckenlogo und ein Kärtchen mit der Aufschrift „läuft lokal“ — Mit LM Studio oder Ollama läuft Qwen3 auf einem besseren Laptop, ganz ohne Cloud.

Für den Einstieg führen vier Wege zum Ziel, je nach technischem Anspruch. Der schnellste läuft über Qwen Chat unter qwen.ai, eine kostenlose Oberfläche im Stil von ChatGPT, mit Chat, Bildverständnis, Bildgenerierung und Dokumentenanalyse.

Wer Qwen in eigene Anwendungen einbauen will, nutzt die API über das Model Studio. Entwickler, die volle Kontrolle brauchen, laden die offenen Gewichte über Hugging Face oder die Alibaba-Plattform ModelScope und betreiben das Modell selbst. Für genau diesen lokalen Weg hat sich eine simple Kombination etabliert.

Diese Kombination heißt LM Studio oder Ollama plus ein passendes Qwen-Modell. Beide Programme sind in wenigen Minuten installiert, danach läuft Qwen3 auf einem besseren Laptop oder einem internen Server, auch offline. Eingaben, Dokumente und Protokolle bleiben dabei vollständig im eigenen Haus.

Watch this video on YouTube

Ist Qwen DSGVO-konform einsetzbar?

Geöffneter Safe mit Akten, Aufkleber „BLEIBT IM HAUS“, Quietscheente und EU-Schild — Im lokalen Betrieb entfällt der heikle Datentransfer nach China komplett.

Hier liegt die eigentliche Entscheidung für deutsche Unternehmen, und die Antwort hängt komplett am Betriebsweg. Die chinesische Cloud-Variante ist datenschutzrechtlich heikel, der lokale Betrieb dagegen entspannt.

Der Grund steckt in Kapitel V der DSGVO. Personenbezogene Daten dürfen nur dann in ein Land außerhalb der EU fließen, sofern dort ein vergleichbares Schutzniveau herrscht. China gilt nicht als sicheres Drittland, und ein im Juni 2026 von Euronews dokumentiertes Gesetz stuft Algorithmen und Daten in China ausdrücklich als schützenswerte Staatsangelegenheit ein. Daten auf chinesischen Servern können also unter Umständen für Behörden zugänglich sein.

Für die offizielle Cloud gibt es einen Mittelweg, den Alibaba selbst anbietet. Im Global-Deployment lassen sich Endpunkt und Datenspeicher auf die Region Frankfurt legen, die Daten bleiben damit physisch in Deutschland. Restzweifel bleiben dennoch, weil der Mutterkonzern chinesischem Recht unterliegt.

Qwen dreht die übliche Cloud-Logik um. Das offene Neun-Milliarden-Modell läuft lokal auf dem Firmenserver, und damit löst sich die China-Datenschutzfrage nicht über Verträge, sondern weil kein einziger Prompt das Haus verlässt.
— Michael Dobler, Herausgeber Dr. Web

Die sauberste Lösung bleibt deshalb der lokale Betrieb der offenen Modelle. Sobald Qwen3 auf dem eigenen Server rechnet, entfällt der Drittstaatentransfer komplett, und die Datensouveränität liegt zu hundert Prozent im Haus. Und falls die Aufsichtsbehörde morgen anfragt, wohin die Prompts gelaufen sind? Die ehrliche Antwort lautet dann nirgendwohin.

🎬 Videoplatzhalter
Suchbegriff für YouTube: chinesische KI DSGVO Datenschutz Unternehmen
Gewünschter Inhalt: Rechtliche Einordnung zum Einsatz chinesischer KI-Dienste in der EU
Bevorzugte Quellen: eRecht24, Datenschutz-Behörden, Fachanwälte für IT-Recht

Wie schlägt sich Qwen gegen ChatGPT, Claude und DeepSeek?

Ein Startblock mit Nummern 1, 2, 3, einem Wecker — Im offenen Lager misst sich Qwen vor allem mit DeepSeek, Meta und Mistral.

Im direkten Vergleich spielt Qwen in zwei Ligen mit. Gegen die geschlossenen Spitzenmodelle aus den USA tritt das proprietäre Qwen3.7-Max an, im offenen Lager misst sich die Reihe vor allem mit DeepSeek, Meta und Mistral.

Anbieter	Herkunft	Offene Gewichte	Lokal betreibbar
Qwen (Alibaba)	China	ja, Apache 2.0	ja
ChatGPT (OpenAI)	USA	nein	nein
Claude (Anthropic)	USA	nein	nein
Gemini (Google)	USA	nein	nein
DeepSeek	China	ja	ja
Mistral	Frankreich	teils	ja

Gegen DeepSeek, den anderen großen chinesischen Namen, punktet Qwen vor allem mit der Breite der Modellpalette, die von winzigen Edge-Modellen bis zum Coder reicht. Wer den klassischen Platzhirsch von OpenAI im Detail kennenlernen will, findet die Einordnung in unserem Beitrag zu GPT-4 und seinen Nachfolgern. Unsere nüchterne Einschätzung: Bei reiner Spitzenleistung führen die geschlossenen US-Modelle weiterhin knapp, beim Verhältnis aus Leistung, Preis und Datenkontrolle hat Qwen jedoch die Nase vorn.

Für wen lohnt sich Qwen, für wen nicht?

Wegweiser zeigt „eigener Server“ und „Cloud“, davor kleiner Server mit blauer Mütze — Die zentrale Weiche heißt nicht ChatGPT oder Qwen, sondern Cloud oder eigener Server.

Eine pauschale Empfehlung wäre unehrlich, denn die Entscheidung hängt an Ihrer Ausgangslage. Klar fällt die Wahl in zwei Richtungen aus.

Für Sie spricht Qwen, sofern Datensouveränität ein hartes Kriterium ist, das Budget auf Token-Kosten reagiert oder ohnehin ein technisches Team im Haus steht. Ein Mittelständler, der Verträge und interne Memos durch eine KI verdichten lassen will, betreibt Qwen3 lokal und gibt dabei keine Zeile nach außen. Gegen Qwen spricht die Lage, sobald eine schlüsselfertige Lösung ohne eigene IT gefragt ist oder niemand die Infrastruktur betreuen kann.

Unterm Strich ist Qwen kein Wundermittel und kein Grund zur Panik, sondern ein erstaunlich vielseitiges Werkzeug. Die richtige Frage für Ihr Unternehmen lautet nicht ChatGPT oder Qwen, sondern Cloud oder eigener Server. Wer diese Weiche bewusst stellt, hat den wichtigsten Teil der Entscheidung schon getroffen.

Glossar: 17 wichtige Fachbegriffe zu Qwen

Offenes blaues Lexikon mit Löffel, Würfelzucker und einem Notizzettel — 17 Fachbegriffe rund um Qwen, von der Apache-Lizenz bis zum Thinking-Modus.

Apache-2.0-Lizenz

Apache-2.0-Lizenz: Eine freizügige Open-Source-Lizenz, die das Nutzen, Verändern und kommerzielle Weitergeben von Software erlaubt. Die meisten offenen Qwen-Modelle stehen unter dieser Lizenz, weshalb Unternehmen die Modelle ohne Gebühren produktiv einsetzen dürfen.

DashScope (Model Studio)

DashScope (Model Studio): Die Cloud-Plattform von Alibaba für den API-Zugriff auf Qwen-Modelle, im internationalen Auftritt als Model Studio bekannt. Über diese Plattform laufen Abrechnung, Modellauswahl und die Wahl der Datenregion.

Datensouveränität

Datensouveränität: Die vollständige Kontrolle eines Unternehmens darüber, wo die eigenen Daten gespeichert und verarbeitet werden. Im lokalen Betrieb von Qwen bleibt diese Kontrolle zu hundert Prozent im eigenen Netzwerk.

Dense-Modell

Dense-Modell: Ein Sprachmodell, bei dem für jede Anfrage alle Parameter rechnen. Im Gegensatz zum MoE-Ansatz sind solche Modelle einfacher zu betreiben, brauchen aber bei gleicher Größe mehr Rechenleistung.

Drittstaatentransfer

Drittstaatentransfer: Die Übermittlung personenbezogener Daten in ein Land außerhalb der EU. Nach Kapitel V der DSGVO ist dieser Transfer nur unter strengen Bedingungen zulässig, was den Einsatz chinesischer Cloud-KI rechtlich erschwert.

Fine-Tuning

Fine-Tuning: Die Nachschulung eines vortrainierten Modells mit eigenen Daten für einen konkreten Anwendungsfall. Offene Qwen-Modelle lassen sich auf diese Weise an Branche oder Unternehmen anpassen.

Hugging Face

Hugging Face: Eine internationale Plattform, über die Entwickler offene KI-Modelle samt Gewichten herunterladen und teilen. Qwen-Modelle gehören dort zu den am häufigsten bezogenen Reihen.

Kontextfenster

Kontextfenster: Die Menge an Text, die ein Modell in einer einzigen Anfrage verarbeiten kann, gemessen in Token. Qwen3.5-Plus erreicht bis zu eine Million Token, genug für sehr lange Dokumente.

Large Language Model (LLM)

Large Language Model (LLM): Ein großes Sprachmodell, das aus riesigen Textmengen statistische Muster gelernt hat und daraus neue Texte erzeugt. Qwen ist eine ganze Familie solcher Modelle.

Mixture of Experts (MoE)

Mixture of Experts (MoE): Eine Architektur, bei der nur ein Teil der Parameter je Anfrage aktiv wird. Qwen3.5 nutzt diesen Ansatz, um bei 397 Milliarden Parametern nur 17 Milliarden gleichzeitig rechnen zu lassen.

Model Context Protocol (MCP)

Model Context Protocol (MCP): Ein offener Standard, über den ein Sprachmodell auf externe Werkzeuge, Datenbanken und Dienste zugreift. Qwen3 unterstützt dieses Protokoll und eignet sich damit als Agenten-Backend.

Multimodalität

Multimodalität: Die Fähigkeit eines Modells, mehrere Datenarten zugleich zu verstehen, etwa Text, Bild, Audio und Video. Die Qwen-VL- und Omni-Reihe bringt diese Fähigkeit mit.

Ollama

Ollama: Ein kostenloses Programm, mit dem sich offene Sprachmodelle auf dem eigenen Rechner betreiben lassen. Über Ollama läuft Qwen3 lokal, ohne Anbindung an eine Cloud.

Open Weights

Open Weights: Frei verfügbare Modellgewichte, die jeder herunterladen und selbst betreiben kann. Bei Qwen bilden die offenen Gewichte die Grundlage für den DSGVO-freundlichen lokalen Betrieb.

Thinking-Modus

Thinking-Modus: Ein Betriebsmodus, in dem das Modell vor der Antwort einen mehrschrittigen Gedankengang durchläuft. Qwen schaltet zwischen diesem Modus und einem schnellen Modus um, um Tempo und Kosten zu steuern.

Token

Token: Die kleinste Recheneinheit für Text, grob ein Wortteil. Die Cloud-Preise von Qwen rechnen je Million Token ab, getrennt nach Eingabe und Ausgabe.

Tongyi Qianwen

Tongyi Qianwen: Der vollständige chinesische Name von Qwen, übersetzt ungefähr „tausend Fragen“. Die Kurzform Qwen hat sich im westlichen Sprachgebrauch durchgesetzt.

FAQ: Was Alibabas KI Qwen für Ihr Unternehmen kann

Ein Glückskeks mit einem Zettel, auf dem — Die sechs häufigsten Fragen zu Qwen, kompakt beantwortet.

Was ist Qwen?

Qwen ist die Familie großer Sprach- und Multimodal-Modelle von Alibaba Cloud, der vollständige Name lautet Tongyi Qianwen. Die Reihe umfasst offene Modelle vom Smartphone-Format bis zum Rechenzentrum sowie ein proprietäres Spitzenmodell und zählt zu den meistgenutzten KI-Modellfamilien weltweit.

Ist Qwen kostenlos nutzbar?

Die offenen Qwen-Modelle unter der Apache-2.0-Lizenz sind kostenlos und auch kommerziell frei verwendbar, lediglich Hardware und Strom verursachen Kosten. Die kostenlose Oberfläche Qwen Chat steht ebenfalls bereit, während der API-Zugang über die Cloud nach Token abgerechnet wird.

Ist Qwen DSGVO-konform einsetzbar?

Im lokalen Betrieb ja, denn dann verlässt kein Datensatz das eigene Netzwerk und der Drittstaatentransfer entfällt. Die chinesische Cloud-Variante ist dagegen kritisch, die EU-Region Frankfurt bildet einen Mittelweg mit verbleibenden rechtlichen Restzweifeln.

Kann Qwen Deutsch?

Ja, Deutsch gehört zum Sprachumfang. Alibaba Cloud nennt für Qwen3 über 119 Sprachen und für Qwen3.5 sogar 201 Sprachen und Dialekte, deutsche Texte versteht und erzeugt die Reihe entsprechend zuverlässig.

Wie betreiben Sie Qwen lokal im Unternehmen?

Über ein kostenloses Programm wie LM Studio oder Ollama laden Sie ein passendes Qwen-Modell herunter und starten das Modell auf einem leistungsfähigen Laptop oder einem internen Server. Die kleineren Modelle laufen bereits auf Standard-Hardware, größere brauchen entsprechend mehr Speicher.

Was ist besser, Qwen oder ChatGPT?

Bei reiner Spitzenleistung führen die geschlossenen US-Modelle weiterhin knapp. Beim Verhältnis aus Leistung, Preis und Datenkontrolle hat Qwen die Nase vorn, vor allem weil sich die offenen Modelle DSGVO-freundlich lokal betreiben lassen.

Quellen

Alibaba Cloud | Model list, Model Studio | https://www.alibabacloud.com/help/en/model-studio/models | besucht am 22.06.2026
Alibaba Cloud | Qwen, Generative AI Solutions | https://www.alibabacloud.com/en/solutions/generative-ai/qwen | besucht am 22.06.2026
CNBC | Alibaba unveils Qwen3.5 as China’s chatbot race shifts to AI agents | https://www.cnbc.com/2026/02/17/china-alibaba-qwen-ai-agent-latest-model.html | besucht am 22.06.2026
South China Morning Post | Alibaba unveils new Qwen model, custom chips in bid to become China’s AI factory | https://www.scmp.com/tech/big-tech/article/3354212/alibaba-unveils-new-qwen-model-custom-chips-bid-become-chinas-ai-factory | besucht am 22.06.2026
Linux-Magazin | Alibaba launcht neue KI-Modelle der Open-Source-Familie Qwen | https://www.linux-magazin.de/news/alibaba-launcht-neue-ki-modelle-der-open-source-familie-qwen/ | besucht am 22.06.2026
Euronews | Neue Regeln zum Geschäftsgeheimnis: China erklärt KI-Daten zur Privatsache | https://de.euronews.com/next/2026/06/02/neue-regeln-zum-geschaftsgeheimnis-china-erklart-ki-daten-zur-privatsache | besucht am 22.06.2026
Europäische Zentralbank | Euro-Referenzkurs US-Dollar | https://www.ecb.europa.eu/stats/policy_and_exchange_rates/euro_reference_exchange_rates/html/eurofxref-graph-usd.en.html | besucht am 22.06.2026

]]>