Alibaba lança o Qwen3.7-Max: o topo de gama para agentes inteligentes, capaz de executar tarefas de forma autónoma durante 35 horas

ref · 20 Maio , 2026 06:57

A equipe do Qwen, da Alibaba, lançou o novo modelo flagship Qwen3.7-Max, voltado para a era dos agentes inteligentes; ele será disponibilizado em breve por meio da API Bailian da Alibaba Cloud. O modelo foi concebido como uma “base universal para agentes inteligentes”, abrangendo três cenários principais: programação (desde protótipos front-end até projetos complexos com múltiplos arquivos), produtividade no ambiente de trabalho (integração com MCP e fluxos de trabalho colaborativos entre diversos agentes) e execução autônoma em períodos prolongados. Em testes de desempenho, o Qwen3.7-Max obteve pontuação de 80,4 no SWE-Verified, valor próximo ao de modelos como Claude Opus 4.6 (80,8) e DeepSeek V4 Pro (80,6). Contudo, superou esses concorrentes em benchmarks específicos: 92,4 pontos no GPQA Diamond (contra 91,3 do Opus-4.6), 69,7 pontos no Terminal Bench 2.0-Terminus (superando os 67,9 do DS-V4-Pro) e 76,4 pontos no MCP-Atlas (acima dos 75,8 do Opus-4.6). A equipe ressalta que tais resultados foram obtidos utilizando diversas plataformas, como Claude Code, OpenClaw e Qwen Code, provando a capacidade real de generalização do modelo em diferentes ambientes.

Para demonstrar sua habilidade de operação autônoma em longos períodos, foram apresentados três casos práticos. No primeiro, referente à otimização do operador Extend Attention do SGLang, o Qwen3.7-Max executou 1.158 chamadas a ferramentas e realizou 432 avaliações de código na plataforma de hardware M890 PPU da Tianjiu Zhenwu, alcançando um ganho médio de 10 vezes em relação à implementação padrão do Triton. Nesse mesmo teste, outros modelos como o GLM 5.1, Kimi K2.6, DeepSeek V4 Pro e Qwen3.6-Plus atingiram ganhos de 7,3; 5,0; 3,3 e 1,1 vezes, respectivamente. Em outro experimento, após monitorar um treinamento de aprendizado por reforço por mais de 80 horas, o modelo gerou 13 regras heurísticas e identificou 1.618 casos de manipulação de recompensas; ao simular a gestão de uma startup, alcançou receita anual de 2,08 milhões de dólares no YC-Bench, quase o dobro dos 1,05 milhão de dólares registrados pelo antecessor Qwen3.6-Plus. Para garantir essa adaptabilidade, os desenvolvedores separaram os exemplos de treinamento em três componentes independentes — tarefa, framework de execução e validador —, fazendo com que o aprendizado por reforço transcenda limites específicos de plataformas, favorecendo estratégias genéricas de resolução de problemas.

WeChat Oficial do Qwen

Tópico	Respostas	Vistas
阿里巴巴发布闭源模型 Qwen3.7-Max，加大强化学习算力投入常规 ai , 大模型 , 阿里巴巴 , qwen , 强化学习	21	21 Maio , 2026
MiniMax M3 发布：MSA架构实现1M超长上下文，Coding与多模态能力进入国际前沿常规 ai , 大模型 , coding , minimax	11	1 Junho , 2026
Alibaba releases Qwen3.7-Plus, flagship vision-capable multimodal model, lifts Alibaba to #5 globally in Vision Arena 常规 ai , qwen , llm , alibaba	15	2 Junho , 2026
深圳联合华为昇腾910C集群完成 1.6 万亿参数 DeepSeek-V4-Pro 全参数后训练，国产算力突破训练瓶颈常规 deepseek , 华为	17	5 Junho , 2026
Anthropic 发布 Claude Opus 4.8：智能体编码成绩升至 69.2%，新增思考强度控制与动态工作流常规 ai , anthropic , 大模型 , 智能体 , claude	7	29 Maio , 2026

Alibaba lança o Qwen3.7-Max: o topo de gama para agentes inteligentes, capaz de executar tarefas de forma autónoma durante 35 horas

Related topics