Alibaba stellt das geschlossene Modell Qwen3.7-Max vor und erhöht die Investitionen in Rechenleistung für den Reinforcement Learning

Das Team von Alibaba’s Tongyi Qianwen veröffentlichte am 20. Mai das closed-source Flaggschiffmodell Qwen3.7-Max. Es erzielte 56,6 Punkte im Artificial Analysis Intelligence Index und belegte bei zahlreichen Benchmarks – etwa im Bereich Programmierung, Mathematik sowie Agent-Aufgaben – den ersten Platz unter chinesischen Modellen. Beim anspruchsvollen Reasoning-Benchmark CritPt verbesserte sich die Leistung des Qwen3.7-Max gegenüber der Vorgängergeneration um fast das Vierfache; dabei übertraf es auch Gemini 3.5 Flash sowie Claude Opus 4.6/4.7. Die Ergebnisse lauten: 92,3 % beim GPQA Diamond, 80,4 % beim SWE-bench Verified und 97,1 % bei den mathematischen Aufgaben des HMMT 2026. Das Modell bietet einen Kontextfenster von bis zu einer Million Tokens; Tests zeigten, dass es 35 Stunden lang stabil läuft und über 1.100 Tool-Aufrufe ausführen kann – ideal also für unternehmenskritische Szenarien mit langen Agent-Pfaden.

Cheng Chujie, Mitglied des Tongyi Qianwen-Teams, gab auf X bekannt, dass die Rechenleistung, die während der Reinforcement-Learning-Phase (RL) eingesetzt wurde, ‚deutlich höher war als je zuvor‘. Er betonte außerdem, dies sei erst der Anfang einer skalierbaren RL-Strategie, die künftig weiter vorangetrieben werde. Derzeit ist das Modell über die Alibaba Cloud Bailian-Plattform per API verfügbar; eine Open-Source-Veröffentlichung steht vorerst nicht an. Gleichzeitig stellte Alibaba seinen selbstentwickelten KI-Chip Zhenwu M890 vor – dieser verfügt über 144 GB Grafikspeicher sowie eine Interconnect-Bandbreite von 800 GB/s.

X @teortaxestex | X @ChujieZheng