Ist Qwen 3.5 kostenlos?

Die Open-Weight-Version ist kostenlos unter der Apache 2.0 Lizenz, herunterladbar und lokal ausführbar. Die gehostete Version Qwen 3.5-Plus kostet über Alibaba Cloud etwa 0,18$ pro Million Token.

Ist Qwen 3.5 wirklich besser als GPT-5 und Claude?

Alibaba beansprucht überlegene Leistungen auf 80% der bewerteten Benchmarks, aber diese Ergebnisse wurden noch nicht unabhängig überprüft. Die KI-Community testet derzeit.

Kann man Qwen 3.5 lokal ausführen?

Die vollständige Version (397B Parameter) erfordert einen GPU-Cluster. Qwen3-Coder-Next (80B, 3B aktiviert) läuft hingegen auf einem MacBook mit 64 GB RAM oder einer RTX 5090. Quantisierte Versionen sind ebenfalls verfügbar.

Unterstützt Qwen 3.5 Deutsch?

Ja. Qwen 3.5 unterstützt 201 Sprachen und Dialekte, einschließlich Deutsch. Der Wortschatz wurde auf 250.000 Token erweitert, um die Sprachabdeckung zu verbessern.

Was ist der Unterschied zwischen Qwen 3.5 und Qwen3-Coder-Next?

Qwen 3.5 ist ein multimodales Generalmodell (Text, Bild, Audio, Video). Qwen3-Coder-Next ist auf Code spezialisiert, kleiner (80B vs. 397B) und für den Betrieb auf Consumer-Hardware optimiert.

Alibabas Qwen 3.5: Das KI-Modell, das GPT-5 und Claude Opus mit 95% weniger Speicher herausfordert

Alibaba Cloud landet einen großen Coup. Am 16. Februar 2026 enthüllte der chinesische Riese Qwen 3.5 – ein künstliches Intelligenzmodell, das angeblich GPT-5.2, Claude Opus 4.5 und Gemini 3 Pro auf 80% der bewerteten Benchmarks übertrifft, während es 95% weniger Speicher verbraucht als ein äquivalentes dichtes Modell.

Wie ist das möglich? Dank einer Mixture-of-Experts (MoE)-Architektur, die 397 Milliarden Parameter enthält, aber nur 17 Milliarden pro Anfrage aktiviert. Das Ergebnis: Spitzenleistung zu einem lächerlich geringen Preis – 1 Million Token für 0,18$.

Eine Entschlüsselung eines Modells, das die Karten auf dem KI-Markt neu mischen könnte.

Die MoE-Architektur: Das Geheimnis von Qwen 3.5

Um zu verstehen, warum Qwen 3.5 bemerkenswert ist, muss man die Mixture-of-Experts-Architektur verstehen. Stellen Sie sich eine Kanzlei mit 397 Experten vor. Für jede Frage konsultieren Sie statt aller 397 nur 17 – die für Ihr Problem relevantesten. Das Ergebnis: die gleiche Antwortqualität, aber viel weniger Ressourcenverbrauch.

Genau das tut Qwen 3.5. Das Modell kombiniert:

397 Milliarden Gesamtparameter – das vollständige Wissen des Modells
17 Milliarden pro Anfrage aktiviert – nur die relevanten Experten werden konsultiert
Hybride Aufmerksamkeit – Mischung aus Gated Linear Attention und Sparse Expert Routing
Natives FP8-Training – Reduzierung des Aktivierungsspeichers um 50%

In der Praxis

Qwen 3.5 erreicht 45 Token/Sekunde auf 8 H100 GPUs, mit einer 8,6x schnelleren Dekodierung bei 32K Kontext-Token und bis zu 19x schneller bei 256K Kontext-Token. Das ist eine Revolution der Effizienz.

Benchmarks: Qwen 3.5 im Vergleich zu den Giganten

Alibaba beansprucht überlegene Leistungen gegenüber GPT-5.2, Claude Opus 4.5 und Gemini 3 Pro auf 80% der bewerteten Benchmarks. Hier sind die wichtigsten Ergebnisse:

Benchmark	Score Qwen 3.5	Kategorie
AIME26	91,3	Mathematik-Olympiaden
MathVista	90,3	Mathematisches Denken
GPQA Diamond	88,4	Denken auf Doktoratsniveau
MMLU	88,5	Allgemeinwissen
MMLU-Pro	87,8	Mehrsprachiges Wissen
LiveCodeBench v6	83,6	Code-Generierung
BFCL v4	72,9	Werkzeugnutzung

Diese Ergebnisse positionieren Qwen 3.5 auf dem Niveau der besten globalen Modelle, während es gleichzeitig open-weight (offene Gewichte) unter der Apache 2.0 Lizenz ist. Dies ist ein starkes Argument gegenüber den geschlossenen Modellen von OpenAI und Anthropic.

Unabhängige Überprüfung läuft

Die von Alibaba angekündigten Benchmarks wurden noch nicht unabhängig überprüft. Wie immer bei Leistungsankündigungen ist Vorsicht geboten, bis die Tests der Community vorliegen.

Native Multimodalität: Text, Bild, Audio und Video

Qwen 3.5 ist das erste Modell der Qwen-Familie, das native Multimodalität bietet. Im Gegensatz zu Modellen, die Text und Bilder separat verarbeiten, integriert Qwen 3.5 nativ:

Text – Verständnis und Generierung in 201 Sprachen und Dialekten
Bilder – Bildanalyse bis zu einer Auflösung von 1344x1344 Pixeln
Audio – Nativ integrierte Audioverarbeitung
Video – Analyse von Videoclips bis zu 2 Stunden

Diese multimodale Fähigkeit, kombiniert mit einem Kontextfenster von 256.000 Token (1 Million für die gehostete Version Qwen 3.5-Plus), macht es zu einem leistungsstarken Werkzeug für Unternehmensanwendungen, die verschiedene Inhaltstypen miteinander verbinden.

Qwen3-Coder-Next: Das Code-Ass

Parallel zu Qwen 3.5 hat Alibaba Qwen3-Coder-Next veröffentlicht – ein auf Code spezialisiertes Modell, das die Entwicklergemeinschaft begeistert. Mit 80 Milliarden Parametern (3B pro Token aktiviert) erreicht es Leistungen, die mit Modellen vergleichbar sind, die 10 bis 20 Mal größer sind:

Benchmark	Score	Vergleichbar mit
SWE-Bench Verified	74,2%	Claude Sonnet 4.5
Aider (Coding Assistant)	69,9%	Spitzenklasse
SWE-Bench Multilingual	63,7%	—
SWE-Bench Pro	44,3%	—
Terminal-Bench 2.0	39,3%	—

Das Beeindruckendste? Qwen3-Coder-Next läuft auf handelsüblicher Hardware: Ein MacBook mit 64 GB RAM, eine RTX 5090 oder eine AMD Radeon 7900 XTX genügen. Dies ist ein entscheidendes Argument für Entwickler, die einen lokalen Code-Copiloten wünschen, ohne vom Cloud abhängig zu sein.

Agenten-KI: Qwen 3.5 für Agenten konzipiert

Qwen 3.5 ist nicht nur ein Konversationsmodell. Es wurde speziell für die Agenten-KI entwickelt – die Fähigkeit, Aufgaben autonom auf mobilen und Desktop-Anwendungen mit visuellem Verständnis auszuführen.

Das Modell integriert nativ:

Strukturierte Tool-Aufrufe – Funktionsaufrufe und native Orchestrierung
Visuelle Navigation – Verständnis der Benutzeroberfläche zur Interaktion mit Anwendungen
Autonome Workflows – Aneinanderreihung von Aufgaben ohne menschliches Eingreifen
Fehlerbehebung – Anpassung, wenn ein Plan nicht funktioniert

Dies ist eine strategische Positionierung: Während ChatGPT und Claude Agentenfunktionen über ihre Konversationsmodelle hinzufügen, wurde Qwen 3.5 von Anfang an für diese Anwendungen konzipiert.

Preise und Verfügbarkeit

Zwei Versionen von Qwen 3.5 sind verfügbar:

Version	Parameter	Kontext	Preis	Lizenz
Qwen 3.5 (Open-Weight)	397B (17B aktiv)	256K Token	Kostenlos (selbst gehostet)	Apache 2.0
Qwen 3.5-Plus (gehostet)	397B+ (optimiert)	1M Token	~0,18$/M Token	Alibaba Cloud API

Die Modelle sind auf [Ollama](/de/unternehmen/ollama), [LM Studio](/de/unternehmen/lm-studio-inc), Together AI, OpenRouter und Hugging Face verfügbar. Die gehostete Version ist über Alibaba Cloud Model Studio zugänglich.

Zum Vergleich: Der Preis von 0,18$ pro Million Token ist 30 bis 50 Mal günstiger als die Tarife von GPT-4 oder Claude Opus für angeblich vergleichbare Leistungen. Wenn sich die Benchmarks bestätigen, ist dies eine große Preisrevolution.

Qwen im globalen KI-Wettlauf

Der Aufstieg von Qwen ist rasant. Im Dezember 2025 übertraf Qwen alle anderen Open-Source-Modelle zusammen in der Anzahl der Downloads auf Hugging Face. Im Januar 2026 wurde Qwen-3 das erste im Orbit betriebene KI-Modell. Mit Qwen 3.5 bekräftigt Alibaba seine Position als weltweit führender Anbieter von Open-Source-KI.

Für europäische Nutzer stellt Qwen eine interessante Alternative zu amerikanischen Modellen dar – auch wenn Fragen der Datensouveränität gegenüber China weiterhin ein Thema der Wachsamkeit bleiben, genau wie bei amerikanischen Modellen.

FAQ

Fazit

Qwen 3.5 ist ein starkes Signal von Alibaba an den Rest der Welt: Die chinesische Open-Source-KI braucht sich vor westlichen Closed-Source-Modellen nicht mehr zu verstecken. Mit angekündigten Leistungen auf dem Niveau von GPT-5.2 und Claude Opus 4.5, einer revolutionären Speichereffizienz und einem 30 bis 50 Mal niedrigeren Preis könnte Qwen 3.5 etablierte Akteure dazu zwingen, ihre Preisstrategie zu überdenken.

Für Unternehmen und Entwickler ist dies eine hervorragende Nachricht: Mehr Wettbewerb bedeutet bessere Tools und niedrigere Preise. Der KI-Markt war noch nie so dynamisch.

Vergleichen Sie KI-Modelle

Zum Vergleich

Alibabas Qwen 3.5: Das KI-Modell, das GPT-5 und Claude Opus mit 95% weniger Speicher herausfordert

Die MoE-Architektur: Das Geheimnis von Qwen 3.5

Benchmarks: Qwen 3.5 im Vergleich zu den Giganten

Native Multimodalität: Text, Bild, Audio und Video

Qwen3-Coder-Next: Das Code-Ass

Agenten-KI: Qwen 3.5 für Agenten konzipiert

Preise und Verfügbarkeit

Qwen im globalen KI-Wettlauf

FAQ

Fazit

Vergleichen Sie KI-Modelle

Zu vergleichende KI-Modelle

Verwandte Artikel

KI mit kleinem Budget nutzen: Leitfaden zu kostenlosen und erschwinglichen Tools

OpenAI Sammelt 110 Milliarden Dollar: Historischer Rekord, Massive Verluste und der Weg zur Billion

Die Gefahren von OpenClaw: Der Mächtigste KI-Agent ist Auch der Riskanteste

Bereit, die besten KI-Tools zu entdecken?

Bleiben Sie über die neuesten KI-Nachrichten informiert

Alibabas Qwen 3.5: Das KI-Modell, das GPT-5 und Claude Opus mit 95% weniger Speicher herausfordert