Qwen2.5 Max: Otra IA china que promete superar a DeepSeek, ChatGPT y Claude
En medio del furor que ha causado la inteligencia artificial china DeepSeek, la empresa Alibaba lanzó Qwen2.5 Max, que según sus reportes supera a varios modelos de uso gratuito, incluido GPT-4o.
Una captura de pantalla muestra cómo Qwen2.5 Max programa un simple juego de buscaminas, como parte de un ejemplo incluido en un video promocional, el 28 de enero de 2025.
- Foto
Captura de pantalla / Qwen
Autor:
Actualizada:
Compartir:
DeepSeek se ha convertido en la insignia de los avances de la inteligencia artificial en China, al menos de momento. Tras el sacudón que la startup fundada por Liang Wenfeng causó en las bolsas de Estados Unidos y las tiendas de apps de varios países, otra empresa china se ha sumado a la carrera que se desarrolla en este sector tecnológico: Alibaba con Qwen2.5 Max.
Este nuevo competidor, según afirman sus desarrolladores, tiene un mejor rendimiento que DeepSeek, ChatGPT y Claude, en algunos casos.
El anuncio de este nuevo modelo de inteligencia artificial se dio casi al mismo tiempo que se supo que DeepSeek, lanzó una herramienta de generación de imágenes, Janus Pro, que, al igual que sus modelos de lenguaje, es gratuita y de código abierto.
Qwen2.5 Max es fruto de una de las múltiples inversiones que el grupo chino Alibaba ha hecho en el sector de la inteligencia artificial.
Alibaba es un grupo inicialmente conocido por su influencia en la industria del comercio electrónico con servicios como AliExpress.
Pero ¿qué rendimiento tiene Qwen2.5 Max?
La 'potencia' de Qwen2.5 Max
De acuerdo con las cifras divulgadas en la página de Github de Qwen, este nuevo modelo de inteligencia artificial puede superar a DeepSeek V3, GPT-4o y Claude 3.5 Sonnet.
Para poner en contexto: el primero (DeepSeek V3) es el modelo básico que se ofrece en la app china de que en los últimos días ha copado las tiendas de aplicaciones; el segundo (GPT-4o) es el que está disponible para los usuarios que usan ChatGPT gratis; y el último (Claude 3.5 Sonnet) es el modelo con el que interactúan los usuarios de la inteligencia artificial de Anthropic que no cuentan con suscripción paga.
Esto quiere decir que el nuevo modelo de inteligencia artificial de Alibaba puede superar, en ocasiones, a los modelos usados por la mayoría de personas que usan apps de chatbots inteligentes.
Sin embargo, un detalle a tomar en cuenta es que las cifras no comparan a Qwen2.5 Max con DeepSeek R1, que es el modelo más avanzado de la startup de Liang Wenfeng, y que es capaz de razonar por cuenta propia.
Según las cifras provistas por el equipo que pertenece a Alibaba, Qwen2.5 Max superó a estos tres modelos en los 'benchmarks' de Arena-Hard y LiveBench (2024-08-31). Estas pruebas miden, en palabras simples, que tan bien se alinean los modelos de IA a las preferencias humanas así como la veracidad de las respuestas de la inteligencia artificial.
En otras tres pruebas, Qwen también pudo superar a DeepSeek V3, mientras que en dos de las mismas logró tener un mejor puntaje que GPT-4o.
Compartir: