Qwen 3.5 de Alibaba: El Modelo de IA que Desafía a GPT-5 y Claude Opus con un 95% Menos de Memoria
Alibaba Cloud da un gran golpe. El 16 de febrero de 2026, el gigante chino presentó Qwen 3.5, un modelo de inteligencia artificial que afirma superar a GPT-5.2, Claude Opus 4.5 y Gemini 3 Pro en el 80% de los benchmarks evaluados, mientras consume un 95% menos de memoria que un modelo denso equivalente.
¿Cómo es posible? Gracias a una arquitectura Mixture-of-Experts (MoE) que incorpora 397 mil millones de parámetros pero solo activa 17 mil millones por solicitud. El resultado: un rendimiento de vanguardia a un costo irrisorio: 1 millón de tokens por 0,18$.
Análisis de un modelo que podría redistribuir las cartas en el mercado de la IA.
La arquitectura MoE: el secreto de Qwen 3.5
Para entender por qué Qwen 3.5 es notable, hay que entender la arquitectura Mixture-of-Experts (Mezcla de Expertos). Imagine un gabinete con 397 expertos. Para cada pregunta, en lugar de consultar a los 397, solo solicita a 17, los más relevantes para su problema. Resultado: la misma calidad de respuesta, pero muchos menos recursos consumidos.
Eso es exactamente lo que hace Qwen 3.5. El modelo combina:
- 397 mil millones de parámetros totales — el conocimiento completo del modelo
- 17 mil millones activados por solicitud — solo se solicitan los expertos relevantes
- Atención híbrida — mezcla de atención lineal con puertas y enrutamiento de expertos dispersos
- Entrenamiento nativo FP8 — reducción del 50% de la memoria de activación
Benchmarks: Qwen 3.5 frente a los gigantes
Alibaba afirma un rendimiento superior a GPT-5.2, Claude Opus 4.5 y Gemini 3 Pro en el 80% de los benchmarks evaluados. Aquí están las puntuaciones clave:
| Benchmark | Puntuación Qwen 3.5 | Categoría |
|---|---|---|
| AIME26 | 91,3 | Olimpiadas de Matemáticas |
| MathVista | 90,3 | Razonamiento matemático |
| GPQA Diamond | 88,4 | Razonamiento a nivel de doctorado |
| MMLU | 88,5 | Conocimientos generales |
| MMLU-Pro | 87,8 | Conocimientos multilingües |
| LiveCodeBench v6 | 83,6 | Generación de código |
| BFCL v4 | 72,9 | Uso de herramientas |
Estos resultados sitúan a Qwen 3.5 al nivel de los mejores modelos mundiales, siendo además open-weight (pesos abiertos) bajo licencia Apache 2.0. Es un argumento de peso frente a los modelos cerrados de OpenAI y Anthropic.
Multimodalidad nativa: texto, imagen, audio y video
Qwen 3.5 es el primer modelo de la familia Qwen en ofrecer multimodalidad nativa. A diferencia de los modelos que procesan texto e imágenes por separado, Qwen 3.5 integra de forma nativa:
- Texto — Comprensión y generación en 201 idiomas y dialectos
- Imágenes — Análisis de imágenes con una resolución de hasta 1344x1344 píxeles
- Audio — Procesamiento de audio integrado de forma nativa
- Video — Análisis de videoclips de hasta 2 horas
Esta capacidad multimodal, combinada con una ventana de contexto de 256.000 tokens (1 millón para la versión alojada Qwen 3.5-Plus), lo convierte en una herramienta potente para casos de uso empresarial que mezclan diferentes tipos de contenido.
Qwen3-Coder-Next: el as del código
Paralelamente a Qwen 3.5, Alibaba lanzó Qwen3-Coder-Next, un modelo especializado en código que está llamando la atención de la comunidad de desarrolladores. Con 80 mil millones de parámetros (3B activados por token), alcanza un rendimiento comparable al de modelos 10 a 20 veces más grandes:
| Benchmark | Puntuación | Comparable a |
|---|---|---|
| SWE-Bench Verified | 74,2% | Claude Sonnet 4.5 |
| Aider (asistente de codificación) | 69,9% | Nivel superior |
| SWE-Bench Multilingual | 63,7% | — |
| SWE-Bench Pro | 44,3% | — |
| Terminal-Bench 2.0 | 39,3% | — |
¿Lo más impresionante? Qwen3-Coder-Next funciona en hardware de consumo: un MacBook con 64 GB de RAM, una RTX 5090 o una AMD Radeon 7900 XTX son suficientes. Es un argumento decisivo para los desarrolladores que quieren un copiloto de código local, sin depender de la nube.
IA agéntica: Qwen 3.5 diseñado para agentes
Qwen 3.5 no es solo un modelo conversacional. Ha sido diseñado específicamente para la IA agéntica, la capacidad de ejecutar tareas de forma autónoma en aplicaciones móviles y de escritorio con comprensión visual.
El modelo integra de forma nativa:
- Llamadas a herramientas estructuradas — Invocación de funciones y orquestación nativa
- Navegación visual — Comprensión de la interfaz para interactuar con las aplicaciones
- Flujos de trabajo autónomos — Encadenamiento de tareas sin intervención humana
- Recuperación en caso de fallo — Adaptación cuando un plan no funciona
Es un posicionamiento estratégico: mientras que ChatGPT y Claude añaden capacidades agénticas sobre sus modelos conversacionales, Qwen 3.5 ha sido diseñado desde el principio para estos usos.
Precio y disponibilidad
Hay dos versiones de Qwen 3.5 disponibles:
| Versión | Parámetros | Contexto | Precio | Licencia |
|---|---|---|---|---|
| Qwen 3.5 (open-weight) | 397B (17B activos) | 256K tokens | Gratis (autoalojado) | Apache 2.0 |
| Qwen 3.5-Plus (alojado) | 397B+ (optimizado) | 1M tokens | ~0,18$/M tokens | API Alibaba Cloud |
Los modelos están disponibles en [Ollama](/es/empresas/ollama), [LM Studio](/es/empresas/lm-studio-inc), Together AI, OpenRouter y Hugging Face. La versión alojada es accesible a través de Alibaba Cloud Model Studio.
A modo de comparación, el precio de 0,18$ por millón de tokens es 30 a 50 veces más barato que las tarifas de GPT-4 o Claude Opus para un rendimiento anunciado comparable. Si los benchmarks se confirman, es un cambio tarifario importante.
Qwen en la carrera mundial de la IA
El ascenso de Qwen es meteórico. En diciembre de 2025, Qwen superó a todos los demás modelos de código abierto combinados en número de descargas en Hugging Face. En enero de 2026, Qwen-3 se convirtió en el primer modelo de IA operado en órbita. Con Qwen 3.5, Alibaba afirma su posición de líder mundial en IA de código abierto.
Para los usuarios europeos, Qwen representa una alternativa interesante a los modelos estadounidenses, aunque las cuestiones de soberanía de datos con respecto a China siguen siendo un tema de vigilancia, al igual que con los modelos estadounidenses.
Preguntas Frecuentes
Conclusión
Qwen 3.5 es una señal fuerte enviada por Alibaba al resto del mundo: la IA de código abierto china no tiene nada que envidiar a los modelos cerrados occidentales. Con un rendimiento anunciado al nivel de GPT-5.2 y Claude Opus 4.5, una eficiencia de memoria revolucionaria y un precio 30 a 50 veces inferior, Qwen 3.5 podría obligar a los actores establecidos a revisar su estrategia de precios.
Para empresas y desarrolladores, es una excelente noticia: más competencia significa mejores herramientas y precios más bajos. El mercado de la IA nunca ha sido tan dinámico.
Compara los modelos de IA
ChatGPT, Claude, Gemini, Mistral, Qwen... encuentra el modelo que mejor se adapta a ti.
Acceder al comparador

