Qwen 3.5 d'Alibaba : Le Modèle IA qui Défie GPT-5 et Claude Opus avec 95% de Mémoire en Moins
Alibaba Cloud frappe un grand coup. Le 16 février 2026, le géant chinois a dévoilé Qwen 3.5 — un modèle d'intelligence artificielle qui prétend surpasser GPT-5.2, Claude Opus 4.5 et Gemini 3 Pro sur 80% des benchmarks évalués, tout en consommant 95% de mémoire en moins qu'un modèle dense équivalent.
Comment est-ce possible ? Grâce à une architecture Mixture-of-Experts (MoE) qui embarque 397 milliards de paramètres mais n'en active que 17 milliards par requête. Le résultat : des performances de pointe à un coût dérisoire — 1 million de tokens pour 0,18$.
Décryptage d'un modèle qui pourrait redistribuer les cartes du marché de l'IA.
L'architecture MoE : le secret de Qwen 3.5
Pour comprendre pourquoi Qwen 3.5 est remarquable, il faut comprendre l'architecture Mixture-of-Experts (Mélange d'Experts). Imaginez un cabinet avec 397 experts. Pour chaque question, au lieu de consulter les 397, vous n'en sollicitez que 17 — les plus pertinents pour votre problème. Résultat : la même qualité de réponse, mais beaucoup moins de ressources consommées.
C'est exactement ce que fait Qwen 3.5. Le modèle combine :
- 397 milliards de paramètres totaux — la connaissance complète du modèle
- 17 milliards activés par requête — seuls les experts pertinents sont sollicités
- Attention hybride — mélange de gated linear attention et sparse expert routing
- Entraînement natif FP8 — réduction de 50% de la mémoire d'activation
Benchmarks : Qwen 3.5 face aux géants
Alibaba revendique des performances supérieures à GPT-5.2, Claude Opus 4.5 et Gemini 3 Pro sur 80% des benchmarks évalués. Voici les scores clés :
| Benchmark | Score Qwen 3.5 | Catégorie |
|---|---|---|
| AIME26 | 91,3 | Mathématiques Olympiades |
| MathVista | 90,3 | Raisonnement mathématique |
| GPQA Diamond | 88,4 | Raisonnement niveau doctorat |
| MMLU | 88,5 | Connaissances générales |
| MMLU-Pro | 87,8 | Connaissances multilingues |
| LiveCodeBench v6 | 83,6 | Génération de code |
| BFCL v4 | 72,9 | Utilisation d'outils |
Ces résultats placent Qwen 3.5 au niveau des meilleurs modèles mondiaux, tout en étant open-weight (poids ouverts) sous licence Apache 2.0. C'est un argument de poids face aux modèles fermés de OpenAI et Anthropic.
Multimodalité native : texte, image, audio et vidéo
Qwen 3.5 est le premier modèle de la famille Qwen à offrir une multimodalité native. Contrairement aux modèles qui traitent séparément texte et images, Qwen 3.5 intègre nativement :
- Texte — Compréhension et génération dans 201 langues et dialectes
- Images — Analyse d'images jusqu'à 1344x1344 pixels de résolution
- Audio — Traitement de l'audio nativement intégré
- Vidéo — Analyse de clips vidéo jusqu'à 2 heures
Cette capacité multimodale, combinée à une fenêtre de contexte de 256 000 tokens (1 million pour la version hébergée Qwen 3.5-Plus), en fait un outil puissant pour les cas d'usage entreprise qui mêlent différents types de contenu.
Qwen3-Coder-Next : l'as du code
Parallèlement à Qwen 3.5, Alibaba a lancé Qwen3-Coder-Next — un modèle spécialisé dans le code qui fait tourner les têtes de la communauté développeur. Avec 80 milliards de paramètres (3B activés par token), il atteint des performances comparables à des modèles 10 à 20 fois plus gros :
| Benchmark | Score | Comparable à |
|---|---|---|
| SWE-Bench Verified | 74,2% | Claude Sonnet 4.5 |
| Aider (coding assistant) | 69,9% | Top tier |
| SWE-Bench Multilingual | 63,7% | — |
| SWE-Bench Pro | 44,3% | — |
| Terminal-Bench 2.0 | 39,3% | — |
Le plus impressionnant ? Qwen3-Coder-Next tourne sur du matériel grand public : un MacBook avec 64 Go de RAM, une RTX 5090 ou une AMD Radeon 7900 XTX suffisent. C'est un argument décisif pour les développeurs qui veulent un copilote de code local, sans dépendre du cloud.
IA agentique : Qwen 3.5 conçu pour les agents
Qwen 3.5 n'est pas qu'un modèle conversationnel. Il a été spécifiquement conçu pour l'IA agentique — la capacité d'exécuter des tâches de manière autonome sur des applications mobiles et desktop avec compréhension visuelle.
Le modèle intègre nativement :
- Appels d'outils structurés — Invocation de fonctions et orchestration native
- Navigation visuelle — Compréhension de l'interface pour interagir avec les applications
- Workflows autonomes — Enchaînement de tâches sans intervention humaine
- Récupération en cas d'échec — Adaptation quand un plan ne fonctionne pas
C'est un positionnement stratégique : alors que ChatGPT et Claude ajoutent des capacités agentiques par-dessus leurs modèles conversationnels, Qwen 3.5 a été conçu dès le départ pour ces usages.
Prix et disponibilité
Deux versions de Qwen 3.5 sont disponibles :
| Version | Paramètres | Contexte | Prix | Licence |
|---|---|---|---|---|
| Qwen 3.5 (open-weight) | 397B (17B actifs) | 256K tokens | Gratuit (auto-hébergé) | Apache 2.0 |
| Qwen 3.5-Plus (hébergé) | 397B+ (optimisé) | 1M tokens | ~0,18$/M tokens | API Alibaba Cloud |
Les modèles sont disponibles sur [Ollama](/en/companies/ollama), [LM Studio](/en/companies/lm-studio-inc), Together AI, OpenRouter et Hugging Face. La version hébergée est accessible via Alibaba Cloud Model Studio.
À titre de comparaison, le pricing de 0,18$ par million de tokens est 30 à 50 fois moins cher que les tarifs de GPT-4 ou Claude Opus pour des performances annoncées comparables. Si les benchmarks se confirment, c'est un bouleversement tarifaire majeur.
Qwen dans la course mondiale à l'IA
La montée en puissance de Qwen est fulgurante. En décembre 2025, Qwen a dépassé tous les autres modèles open-source combinés en nombre de téléchargements sur Hugging Face. En janvier 2026, Qwen-3 est devenu le premier modèle IA opéré en orbite. Avec Qwen 3.5, Alibaba affirme sa position de leader de l'IA open-source mondiale.
Pour les utilisateurs européens, Qwen représente une alternative intéressante aux modèles américains — même si les questions de souveraineté des données vis-à -vis de la Chine restent un sujet de vigilance, tout comme elles le sont avec les modèles américains.
FAQ
Conclusion
Qwen 3.5 est un signal fort envoyé par Alibaba au reste du monde : l'IA open-source chinoise n'a plus rien à envier aux modèles fermés occidentaux. Avec des performances annoncées au niveau de GPT-5.2 et Claude Opus 4.5, une efficacité mémoire révolutionnaire et un prix 30 à 50 fois inférieur, Qwen 3.5 pourrait forcer les acteurs établis à revoir leur stratégie tarifaire.
Pour les entreprises et développeurs, c'est une excellente nouvelle : plus de concurrence signifie de meilleurs outils et des prix plus bas. Le marché de l'IA n'a jamais été aussi dynamique.
Comparez les modèles IA
ChatGPT, Claude, Gemini, Mistral, Qwen... trouvez le modèle qui vous correspond.
Accéder au comparateur

