El martes, Alibaba presentó Qwen Robot Suite, su primera serie integral de modelos de gran tamaño para inteligencia incorporada, desarrollada por su unidad de investigación en IA, Tongyi Lab. La suite divide la inteligencia robótica en tres capas interconectadas: Qwen-RobotNav, un modelo de navegación visual-lingüística que unifica el seguimiento de instrucciones, la navegación por objetivos, el seguimiento de objetos y la conducción autónoma en un único marco; Qwen-RobotWorld, un modelo de mundo en video que permite a las máquinas predecir cómo evolucionarán las escenas físicas antes de actuar, abarcando contextos de manipulación, conducción y navegación; y Qwen-RobotManip, un modelo generalista visión-lenguaje-acción (VLA) basado en la arquitectura Qwen3.5-4B y entrenado con un corpus de más de 38.100 horas ensamblado íntegramente a partir de datos de código abierto. Las tres ofrecen interfaces basadas en lenguaje y se pueden componer mediante llamadas estándar al modelo Qwen. Alibaba indicó que la suite ha entrado en fase de pruebas piloto con clientes empresariales seleccionados de Alibaba Cloud.
Junto a los tres modelos, Alibaba dio a conocer Qwen-RobotClaw, un marco de agente interno que permite a los modelos de lenguaje visual de Qwen invocar los componentes de Robot Suite como herramientas para la ejecución en el mundo físico, gestionando el contexto y la memoria necesarios para sesiones de hasta 20 minutos, lo que permite una planificación sostenida a largo plazo más allá de la reacción visual fotograma a fotograma. El lanzamiento extiende la familia de modelos Qwen —que ya abarca texto, visión, código, audio y video— al mundo físico, y la posiciona como un posible sustrato general para aplicaciones robóticas. También marca la entrada formal de Alibaba en la carrera de la «IA incorporada», compitiendo con rivales como Google DeepMind, Figure AI y ByteDance, todos ellos pugnando por trasladar los modelos de IA desde las interfaces digitales a máquinas que puedan percibir y actuar en entornos reales.