sus ventajas y cómo probarla


El gigante digital chino Alibaba anunció este miércoles el lanzamiento de un nuevo modelo de su inteligencia artificial (IA) Qwen, llamado Qwen2.5-Max, del que afirma que supera «casi totalmente» al V3 de DeepSeek que tanto revuelo generó a nivel internacional en los últimos días.

En un comunicado publicado en su cuenta oficial de la red social WeChat, la división de computación en la nube (‘cloud’) del grupo, Alibaba Cloud, también incluyó al GPT-4o de OpenAI o a Llama-3.1-405B de Meta como modelos a los que dice superar, y apuntó que la última versión de su Qwen está a la par con el Claude-3.5-Sonnet de Anthropic.

El portal de noticias corporativo de Alibaba, Alizila, explica que el Qwen2.5-Max «sobresale» en la comprensión avanzada de textos, tablas, diagramas, gráficos y disposición de imágenes, y además puede entender vídeos de más de una hora y responder a preguntas relacionadas con ellos, identificando segmentos con el segundo específico.

La tecnológica también destaca la capacidad de su modelo para convertir datos de facturas, formularios o tablas en productos estructurados, «lo que es especialmente útil para automatizar el procesamiento de informes financieros o documentos legales».

IA: una pelea feroz en todo el mundo

Alibaba es un gigante tech de China. Foto: Reuters

Alibaba presentó en abril de 2023 su alternativa a ChatGPT, denominada Tongyi Qianwen (en mandarín, algo así como «la verdad, desde mil preguntas»), y se unió así a otros rivales chinos de OpenAI como el ‘Google chino’ Baidu, que también había acaparado titulares con su ERNIE Bot.

DeepSeek, prácticamente anónima a nivel internacional hasta hace unos días, saltó al tablero mundial de la IA con el lanzamiento de su modelo V3, de cuyo desarrollo se afirma que únicamente duró dos meses y solo costó menos de 6 millones de dólares. El 20 de enero publicó su última versión, denominada R1.

Los medios oficiales chinos celebraron el éxito de DeepSeek y destacaron lo asequible de su modelo frente a competidores estadounidenses -ofrece servicios un 95 % más baratos que el o1 de OpenAI-, haciéndose eco asimismo de la atención que acaparó entre dirigentes de tecnológicas del país norteamericano o incluso de su nuevo presidente, Donald Trump.

Lanzado en 2023 por el fondo de cobertura chino High-Flyer Quant, DeepSeek apuesta por el código abierto y ofrece servicios un 95 % más baratos que el modelo o1 de OpenAI.

No obstante, la gran atención que atrajo -se colocó líder en descargas para dispositivos Apple en Estados Unidos- también se tradujo en críticas, ya que su ‘app’ se niega a comentar sobre cuestiones afectadas por la censura en China como la Masacre de Tiananmen de 1989 o si Taiwán forma parte de China.

Este mismo fenómeno sucedía con otras IA conversacionales chinas, según se comprobó en 2023, mismo año en el que Pekín reguló estos servicios para que respeten «los valores socialistas fundamentales», con lo que tienen prohibido «generar contenidos que atenten contra la seguridad nacional, la unidad territorial y la estabilidad social».

Cómo probar Qwen

Deepseek y Alibaba, competidores en IA en China. Foto: ReutersDeepseek y Alibaba, competidores en IA en China. Foto: Reuters

Para probar Qwen, el primer paso es acceder a su repositorio en Hugging Face o GitHub, donde Alibaba Cloud ha publicado tanto los modelos como las instrucciones de implementación. Es necesario contar con conocimientos básicos de programación en Python y tener instalado un entorno como Google Colab o una máquina con GPU para ejecutar el modelo con mayor eficiencia. Una vez descargado el modelo, se pueden cargar los pesos preentrenados y utilizar librerías como Transformers de Hugging Face para interactuar con la IA.

Otro método más accesible es probar Qwen a través de la plataforma ModelScope, un servicio en la nube de Alibaba que permite ejecutar los modelos sin necesidad de una configuración local.

Sólo es necesario crear una cuenta, seleccionar la versión del modelo Qwen y comenzar a generar texto desde la interfaz web. Esta opción es ideal para quienes no tienen experiencia en programación pero quieren experimentar con la IA de Alibaba de forma sencilla.

El desarrollo de Qwen refleja el interés de China en liderar el sector de la inteligencia artificial con tecnologías propias y de código abierto. Su disponibilidad para la comunidad global permite explorar alternativas a los modelos estadounidenses y fomenta la innovación en diversas aplicaciones. Con estas opciones de prueba, tanto desarrolladores como curiosos de la tecnología pueden experimentar con una IA avanzada sin barreras de acceso.

Inteligencia artificial con anabólicos: mejor que Llama y DeepSeek V3

LLaMA 3, la IA de Meta. Foto: MetaLLaMA 3, la IA de Meta. Foto: Meta

A través de una publicación en el blog oficial de Qwen, Alibaba reveló los avances conseguidos con la última versión de su modelo de lenguaje. Al enfrentar a Qwen 2.5 Max con los últimos modelos de Llama y DeepSeek, las puntuaciones obtenidas por el modelo de AliBaba fueron sido superiores en muchos de los casos.

Qwen 2.5 Max emplea una arquitectura similar a la de DeepSeek, conocida como Mixture of Experts o MoE, por sus siglas en inglés, que permite a los modelos ser mucho más eficientes y escalables. Con esta arquitectura, en lugar de tener un modelo monolítico con todo el conocimiento, este se divide en varios «expertos», cada uno especializado en un subconjunto de datos o tareas. Otro elemento, el «enrutador», decide cuál de estos expertos es el más adecuado para procesar una entrada específica.

El uso de esta técnica, sumada a los avances en el entrenamiento con más de 20.000 millones de tókens y las metodologías de Ajuste Fino Supervisado (SFT) y Aprendizaje de Refuerzo a Partir de Retroalumentación Humana (RLHF), permitieron a Alibaba crear uno de los modelos más avanzados del momento.

Las pruebas demostraron que Qwen2.5-Max supera a DeepSeek V3 en las pruebas de referencia como Arena-Hard, LiveBench, LiveCodeBench y GPQA-Diamond, a la vez que ofrece resultados muy competitivos en otros tipos de tests, incluyendo MMLU-Pro.

El uso, es decir, las aplicaciones concretas, determinaran el futuro de estas tecnologías.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Social Media Auto Publish Powered By : XYZScripts.com