¿Es Qwen 3.5 gratuito?

La versión de código abierto es gratuita bajo licencia Apache 2.0, descargable y ejecutable localmente. La versión alojada Qwen 3.5-Plus cuesta aproximadamente 0,18$ por millón de tokens a través de Alibaba Cloud.

¿Es Qwen 3.5 realmente mejor que GPT-5 y Claude?

Alibaba afirma un rendimiento superior en el 80% de los benchmarks evaluados, pero estos resultados aún no han sido verificados de forma independiente. La comunidad de IA está realizando pruebas.

¿Se puede ejecutar Qwen 3.5 localmente?

La versión completa (397B parámetros) requiere un clúster de GPU. Sin embargo, Qwen3-Coder-Next (80B, 3B activados) funciona en un MacBook de 64 GB o una RTX 5090. También hay versiones cuantificadas disponibles.

¿Qwen 3.5 soporta español?

Sí. Qwen 3.5 soporta 201 idiomas y dialectos, incluido el español. El vocabulario se ha ampliado a 250.000 tokens para mejorar la cobertura lingüística.

¿Cuál es la diferencia entre Qwen 3.5 y Qwen3-Coder-Next?

Qwen 3.5 es un modelo generalista multimodal (texto, imagen, audio, video). Qwen3-Coder-Next está especializado en código, es más pequeño (80B vs 397B) y está optimizado para funcionar en hardware de consumo.

Qwen 3.5 de Alibaba: El Modelo de IA que Desafía a GPT-5 y Claude Opus con un 95% Menos de Memoria

Alibaba Cloud da un gran golpe. El 16 de febrero de 2026, el gigante chino presentó Qwen 3.5, un modelo de inteligencia artificial que afirma superar a GPT-5.2, Claude Opus 4.5 y Gemini 3 Pro en el 80% de los benchmarks evaluados, mientras consume un 95% menos de memoria que un modelo denso equivalente.

¿Cómo es posible? Gracias a una arquitectura Mixture-of-Experts (MoE) que incorpora 397 mil millones de parámetros pero solo activa 17 mil millones por solicitud. El resultado: un rendimiento de vanguardia a un costo irrisorio: 1 millón de tokens por 0,18$.

Análisis de un modelo que podría redistribuir las cartas en el mercado de la IA.

La arquitectura MoE: el secreto de Qwen 3.5

Para entender por qué Qwen 3.5 es notable, hay que entender la arquitectura Mixture-of-Experts (Mezcla de Expertos). Imagine un gabinete con 397 expertos. Para cada pregunta, en lugar de consultar a los 397, solo solicita a 17, los más relevantes para su problema. Resultado: la misma calidad de respuesta, pero muchos menos recursos consumidos.

Eso es exactamente lo que hace Qwen 3.5. El modelo combina:

397 mil millones de parámetros totales — el conocimiento completo del modelo
17 mil millones activados por solicitud — solo se solicitan los expertos relevantes
Atención híbrida — mezcla de atención lineal con puertas y enrutamiento de expertos dispersos
Entrenamiento nativo FP8 — reducción del 50% de la memoria de activación

En la práctica

Qwen 3.5 alcanza 45 tokens/segundo en 8 GPU H100, con una decodificación 8,6 veces más rápida a 32K tokens de contexto y hasta 19 veces más rápida a 256K tokens. Es una revolución en eficiencia.

Benchmarks: Qwen 3.5 frente a los gigantes

Alibaba afirma un rendimiento superior a GPT-5.2, Claude Opus 4.5 y Gemini 3 Pro en el 80% de los benchmarks evaluados. Aquí están las puntuaciones clave:

Benchmark	Puntuación Qwen 3.5	Categoría
AIME26	91,3	Olimpiadas de Matemáticas
MathVista	90,3	Razonamiento matemático
GPQA Diamond	88,4	Razonamiento a nivel de doctorado
MMLU	88,5	Conocimientos generales
MMLU-Pro	87,8	Conocimientos multilingües
LiveCodeBench v6	83,6	Generación de código
BFCL v4	72,9	Uso de herramientas

Estos resultados sitúan a Qwen 3.5 al nivel de los mejores modelos mundiales, siendo además open-weight (pesos abiertos) bajo licencia Apache 2.0. Es un argumento de peso frente a los modelos cerrados de OpenAI y Anthropic.

Verificación independiente en curso

Los benchmarks anunciados por Alibaba aún no han sido verificados de forma independiente. Como siempre con los anuncios de rendimiento, es prudente ser cauteloso a la espera de las pruebas de la comunidad.

Multimodalidad nativa: texto, imagen, audio y video

Qwen 3.5 es el primer modelo de la familia Qwen en ofrecer multimodalidad nativa. A diferencia de los modelos que procesan texto e imágenes por separado, Qwen 3.5 integra de forma nativa:

Texto — Comprensión y generación en 201 idiomas y dialectos
Imágenes — Análisis de imágenes con una resolución de hasta 1344x1344 píxeles
Audio — Procesamiento de audio integrado de forma nativa
Video — Análisis de videoclips de hasta 2 horas

Esta capacidad multimodal, combinada con una ventana de contexto de 256.000 tokens (1 millón para la versión alojada Qwen 3.5-Plus), lo convierte en una herramienta potente para casos de uso empresarial que mezclan diferentes tipos de contenido.

Qwen3-Coder-Next: el as del código

Paralelamente a Qwen 3.5, Alibaba lanzó Qwen3-Coder-Next, un modelo especializado en código que está llamando la atención de la comunidad de desarrolladores. Con 80 mil millones de parámetros (3B activados por token), alcanza un rendimiento comparable al de modelos 10 a 20 veces más grandes:

Benchmark	Puntuación	Comparable a
SWE-Bench Verified	74,2%	Claude Sonnet 4.5
Aider (asistente de codificación)	69,9%	Nivel superior
SWE-Bench Multilingual	63,7%	—
SWE-Bench Pro	44,3%	—
Terminal-Bench 2.0	39,3%	—

¿Lo más impresionante? Qwen3-Coder-Next funciona en hardware de consumo: un MacBook con 64 GB de RAM, una RTX 5090 o una AMD Radeon 7900 XTX son suficientes. Es un argumento decisivo para los desarrolladores que quieren un copiloto de código local, sin depender de la nube.

IA agéntica: Qwen 3.5 diseñado para agentes

Qwen 3.5 no es solo un modelo conversacional. Ha sido diseñado específicamente para la IA agéntica, la capacidad de ejecutar tareas de forma autónoma en aplicaciones móviles y de escritorio con comprensión visual.

El modelo integra de forma nativa:

Llamadas a herramientas estructuradas — Invocación de funciones y orquestación nativa
Navegación visual — Comprensión de la interfaz para interactuar con las aplicaciones
Flujos de trabajo autónomos — Encadenamiento de tareas sin intervención humana
Recuperación en caso de fallo — Adaptación cuando un plan no funciona

Es un posicionamiento estratégico: mientras que ChatGPT y Claude añaden capacidades agénticas sobre sus modelos conversacionales, Qwen 3.5 ha sido diseñado desde el principio para estos usos.

Precio y disponibilidad

Hay dos versiones de Qwen 3.5 disponibles:

Versión	Parámetros	Contexto	Precio	Licencia
Qwen 3.5 (open-weight)	397B (17B activos)	256K tokens	Gratis (autoalojado)	Apache 2.0
Qwen 3.5-Plus (alojado)	397B+ (optimizado)	1M tokens	~0,18$/M tokens	API Alibaba Cloud

Los modelos están disponibles en [Ollama](/es/empresas/ollama), [LM Studio](/es/empresas/lm-studio-inc), Together AI, OpenRouter y Hugging Face. La versión alojada es accesible a través de Alibaba Cloud Model Studio.

A modo de comparación, el precio de 0,18$ por millón de tokens es 30 a 50 veces más barato que las tarifas de GPT-4 o Claude Opus para un rendimiento anunciado comparable. Si los benchmarks se confirman, es un cambio tarifario importante.

Qwen en la carrera mundial de la IA

El ascenso de Qwen es meteórico. En diciembre de 2025, Qwen superó a todos los demás modelos de código abierto combinados en número de descargas en Hugging Face. En enero de 2026, Qwen-3 se convirtió en el primer modelo de IA operado en órbita. Con Qwen 3.5, Alibaba afirma su posición de líder mundial en IA de código abierto.

Para los usuarios europeos, Qwen representa una alternativa interesante a los modelos estadounidenses, aunque las cuestiones de soberanía de datos con respecto a China siguen siendo un tema de vigilancia, al igual que con los modelos estadounidenses.

Preguntas Frecuentes

Conclusión

Qwen 3.5 es una señal fuerte enviada por Alibaba al resto del mundo: la IA de código abierto china no tiene nada que envidiar a los modelos cerrados occidentales. Con un rendimiento anunciado al nivel de GPT-5.2 y Claude Opus 4.5, una eficiencia de memoria revolucionaria y un precio 30 a 50 veces inferior, Qwen 3.5 podría obligar a los actores establecidos a revisar su estrategia de precios.

Para empresas y desarrolladores, es una excelente noticia: más competencia significa mejores herramientas y precios más bajos. El mercado de la IA nunca ha sido tan dinámico.

Compara los modelos de IA

ChatGPT, Claude, Gemini, Mistral, Qwen... encuentra el modelo que mejor se adapta a ti.

Acceder al comparador

Qwen 3.5 de Alibaba: El Modelo de IA que Desafía a GPT-5 y Claude Opus con un 95% Menos de Memoria

La arquitectura MoE: el secreto de Qwen 3.5

Benchmarks: Qwen 3.5 frente a los gigantes

Multimodalidad nativa: texto, imagen, audio y video

Qwen3-Coder-Next: el as del código

IA agéntica: Qwen 3.5 diseñado para agentes

Precio y disponibilidad

Qwen en la carrera mundial de la IA

Preguntas Frecuentes

Conclusión

Compara los modelos de IA

Los modelos de IA a comparar

Artículos relacionados

Cómo Usar la IA con un Presupuesto Limitado: Guía de Herramientas Gratuitas y Asequibles

OpenAI Recauda 110.000 Millones de Dólares: Récord Histórico, Pérdidas Abismales y la Carrera Hacia el Billón

Los Peligros de OpenClaw: El Agente IA Más Potente También es el Más Arriesgado

¿Listo para descubrir las mejores herramientas de IA?

Mantente informado sobre las últimas noticias de IA

Qwen 3.5 de Alibaba: El Modelo de IA que Desafía a GPT-5 y Claude Opus con un 95% Menos de Memoria