Qwen 3.5 de Alibaba Supera a GPT-4o de OpenAI
Alibaba ha lanzado la serie de modelos pequeños Qwen 3.5, proclamando que el modelo de 9B supera a sistemas mucho más grandes como GPT-4o de OpenAI y Gemini de Google. Los modelos están disponibles bajo licencia Apache 2.0 en Hugging Face y ModelScope.
Detalles del lanzamiento
Alibaba lanzó cuatro modelos compactos Qwen 3.5 (desde 0.8B hasta 9B), afirmando que la variante de 9B ofrece un rendimiento cercano a sistemas mucho más grandes que alimentan herramientas como ChatGPT de OpenAI y Gemini de Google.
Innovación técnica
La base técnica de la serie Qwen 3.5 representa una desviación de las arquitecturas Transformer estándar. Alibaba ha avanzado hacia una Arquitectura Híbrida Eficiente que combina:
- Gated Delta Networks: Una forma de atención lineal.
- Mixture-of-Experts (MoE): Arquitectura dispersa para mayor eficiencia.
Impresiones de Elon Musk
Incluso Elon Musk se ha mostrado impresionado con los nuevos modelos de código abierto de Alibaba.
Fuente: VentureBeat



Publicar comentario