Alibabas Qwen 3.5: Das KI-Modell, das GPT-5 und Claude Opus mit 95% weniger Speicher herausfordert
Alibaba Cloud landet einen großen Coup. Am 16. Februar 2026 enthüllte der chinesische Riese Qwen 3.5 – ein künstliches Intelligenzmodell, das angeblich GPT-5.2, Claude Opus 4.5 und Gemini 3 Pro auf 80% der bewerteten Benchmarks übertrifft, während es 95% weniger Speicher verbraucht als ein äquivalentes dichtes Modell.
Wie ist das möglich? Dank einer Mixture-of-Experts (MoE)-Architektur, die 397 Milliarden Parameter enthält, aber nur 17 Milliarden pro Anfrage aktiviert. Das Ergebnis: Spitzenleistung zu einem lächerlich geringen Preis – 1 Million Token für 0,18$.
Eine Entschlüsselung eines Modells, das die Karten auf dem KI-Markt neu mischen könnte.
Die MoE-Architektur: Das Geheimnis von Qwen 3.5
Um zu verstehen, warum Qwen 3.5 bemerkenswert ist, muss man die Mixture-of-Experts-Architektur verstehen. Stellen Sie sich eine Kanzlei mit 397 Experten vor. Für jede Frage konsultieren Sie statt aller 397 nur 17 – die für Ihr Problem relevantesten. Das Ergebnis: die gleiche Antwortqualität, aber viel weniger Ressourcenverbrauch.
Genau das tut Qwen 3.5. Das Modell kombiniert:
- 397 Milliarden Gesamtparameter – das vollständige Wissen des Modells
- 17 Milliarden pro Anfrage aktiviert – nur die relevanten Experten werden konsultiert
- Hybride Aufmerksamkeit – Mischung aus Gated Linear Attention und Sparse Expert Routing
- Natives FP8-Training – Reduzierung des Aktivierungsspeichers um 50%
Benchmarks: Qwen 3.5 im Vergleich zu den Giganten
Alibaba beansprucht überlegene Leistungen gegenüber GPT-5.2, Claude Opus 4.5 und Gemini 3 Pro auf 80% der bewerteten Benchmarks. Hier sind die wichtigsten Ergebnisse:
| Benchmark | Score Qwen 3.5 | Kategorie |
|---|---|---|
| AIME26 | 91,3 | Mathematik-Olympiaden |
| MathVista | 90,3 | Mathematisches Denken |
| GPQA Diamond | 88,4 | Denken auf Doktoratsniveau |
| MMLU | 88,5 | Allgemeinwissen |
| MMLU-Pro | 87,8 | Mehrsprachiges Wissen |
| LiveCodeBench v6 | 83,6 | Code-Generierung |
| BFCL v4 | 72,9 | Werkzeugnutzung |
Diese Ergebnisse positionieren Qwen 3.5 auf dem Niveau der besten globalen Modelle, während es gleichzeitig open-weight (offene Gewichte) unter der Apache 2.0 Lizenz ist. Dies ist ein starkes Argument gegenüber den geschlossenen Modellen von OpenAI und Anthropic.
Native Multimodalität: Text, Bild, Audio und Video
Qwen 3.5 ist das erste Modell der Qwen-Familie, das native Multimodalität bietet. Im Gegensatz zu Modellen, die Text und Bilder separat verarbeiten, integriert Qwen 3.5 nativ:
- Text – Verständnis und Generierung in 201 Sprachen und Dialekten
- Bilder – Bildanalyse bis zu einer Auflösung von 1344x1344 Pixeln
- Audio – Nativ integrierte Audioverarbeitung
- Video – Analyse von Videoclips bis zu 2 Stunden
Diese multimodale Fähigkeit, kombiniert mit einem Kontextfenster von 256.000 Token (1 Million für die gehostete Version Qwen 3.5-Plus), macht es zu einem leistungsstarken Werkzeug für Unternehmensanwendungen, die verschiedene Inhaltstypen miteinander verbinden.
Qwen3-Coder-Next: Das Code-Ass
Parallel zu Qwen 3.5 hat Alibaba Qwen3-Coder-Next veröffentlicht – ein auf Code spezialisiertes Modell, das die Entwicklergemeinschaft begeistert. Mit 80 Milliarden Parametern (3B pro Token aktiviert) erreicht es Leistungen, die mit Modellen vergleichbar sind, die 10 bis 20 Mal größer sind:
| Benchmark | Score | Vergleichbar mit |
|---|---|---|
| SWE-Bench Verified | 74,2% | Claude Sonnet 4.5 |
| Aider (Coding Assistant) | 69,9% | Spitzenklasse |
| SWE-Bench Multilingual | 63,7% | — |
| SWE-Bench Pro | 44,3% | — |
| Terminal-Bench 2.0 | 39,3% | — |
Das Beeindruckendste? Qwen3-Coder-Next läuft auf handelsüblicher Hardware: Ein MacBook mit 64 GB RAM, eine RTX 5090 oder eine AMD Radeon 7900 XTX genügen. Dies ist ein entscheidendes Argument für Entwickler, die einen lokalen Code-Copiloten wünschen, ohne vom Cloud abhängig zu sein.
Agenten-KI: Qwen 3.5 für Agenten konzipiert
Qwen 3.5 ist nicht nur ein Konversationsmodell. Es wurde speziell für die Agenten-KI entwickelt – die Fähigkeit, Aufgaben autonom auf mobilen und Desktop-Anwendungen mit visuellem Verständnis auszuführen.
Das Modell integriert nativ:
- Strukturierte Tool-Aufrufe – Funktionsaufrufe und native Orchestrierung
- Visuelle Navigation – Verständnis der Benutzeroberfläche zur Interaktion mit Anwendungen
- Autonome Workflows – Aneinanderreihung von Aufgaben ohne menschliches Eingreifen
- Fehlerbehebung – Anpassung, wenn ein Plan nicht funktioniert
Dies ist eine strategische Positionierung: Während ChatGPT und Claude Agentenfunktionen über ihre Konversationsmodelle hinzufügen, wurde Qwen 3.5 von Anfang an für diese Anwendungen konzipiert.
Preise und Verfügbarkeit
Zwei Versionen von Qwen 3.5 sind verfügbar:
| Version | Parameter | Kontext | Preis | Lizenz |
|---|---|---|---|---|
| Qwen 3.5 (Open-Weight) | 397B (17B aktiv) | 256K Token | Kostenlos (selbst gehostet) | Apache 2.0 |
| Qwen 3.5-Plus (gehostet) | 397B+ (optimiert) | 1M Token | ~0,18$/M Token | Alibaba Cloud API |
Die Modelle sind auf [Ollama](/de/unternehmen/ollama), [LM Studio](/de/unternehmen/lm-studio-inc), Together AI, OpenRouter und Hugging Face verfügbar. Die gehostete Version ist über Alibaba Cloud Model Studio zugänglich.
Zum Vergleich: Der Preis von 0,18$ pro Million Token ist 30 bis 50 Mal günstiger als die Tarife von GPT-4 oder Claude Opus für angeblich vergleichbare Leistungen. Wenn sich die Benchmarks bestätigen, ist dies eine große Preisrevolution.
Qwen im globalen KI-Wettlauf
Der Aufstieg von Qwen ist rasant. Im Dezember 2025 übertraf Qwen alle anderen Open-Source-Modelle zusammen in der Anzahl der Downloads auf Hugging Face. Im Januar 2026 wurde Qwen-3 das erste im Orbit betriebene KI-Modell. Mit Qwen 3.5 bekräftigt Alibaba seine Position als weltweit führender Anbieter von Open-Source-KI.
Für europäische Nutzer stellt Qwen eine interessante Alternative zu amerikanischen Modellen dar – auch wenn Fragen der Datensouveränität gegenüber China weiterhin ein Thema der Wachsamkeit bleiben, genau wie bei amerikanischen Modellen.
FAQ
Fazit
Qwen 3.5 ist ein starkes Signal von Alibaba an den Rest der Welt: Die chinesische Open-Source-KI braucht sich vor westlichen Closed-Source-Modellen nicht mehr zu verstecken. Mit angekündigten Leistungen auf dem Niveau von GPT-5.2 und Claude Opus 4.5, einer revolutionären Speichereffizienz und einem 30 bis 50 Mal niedrigeren Preis könnte Qwen 3.5 etablierte Akteure dazu zwingen, ihre Preisstrategie zu überdenken.
Für Unternehmen und Entwickler ist dies eine hervorragende Nachricht: Mehr Wettbewerb bedeutet bessere Tools und niedrigere Preise. Der KI-Markt war noch nie so dynamisch.


