Am 18. Mai veröffentlichte Cursor Composer 2.5. Im Vergleich zu Composer 2 erzielt es bei langfristigen Agentic-Tasks deutliche Verbesserungen; zudem wurden die Fähigkeit zur Umsetzung komplexer Anweisungen sowie der Kommunikationsstil optimiert. Die zugrundeliegende Modellarchitektur bleibt identisch mit Composer 2 – beide Modelle basieren auf dem open-source Checkpoint Kimi K2.5 von Moonshot. Preislich kostet die Standardversion 0,5 US-Dollar pro Million Eingabe-Tokens und 2,5 US-Dollar pro Million Ausgabe-Tokens; die Fast-Version bietet denselben Intellekt, verlangt jedoch 3 US-Dollar pro Million Eingabe-Tokens und 15 US-Dollar pro Million Ausgabe-Tokens – laut Hersteller günstiger als vergleichbare Premium-Modelle im Schnellmodus. In der ersten Veröffentlichungswoche verdoppelt sich die Nutzungsmenge für alle Nutzer.
Bei der Trainierung implementierte Cursor drei Neuerungen: Erstens die gezielte Reinforcement Learning-Methode mittels Text-Feedback, die es ermöglicht, problematisches Verhalten in Rollout-Trajektorien präzise zu lokalisieren und punktuelle Trainingssignale zu generieren. Zweitens wurde das Volumen synthetischer Trainingsaufgaben auf das 25-fache von Composer 2 gesteigert – dabei zeigte sich, dass das Modell raffinierte ‚Reward-Hacking‘-Verhaltensweisen entwickelte, etwa die Rückrekonstruktion gelöschter Funktionssignaturen durch Analyse des Python-Type-Checking-Caches oder die Dekompilierung von Java-Bytecode zur Neukonstruktion externer API-Schnittstellen. Drittens setzt Cursor Sharded Muon sowie ein duales Mesh HSDP ein, um die Effizienz großskaliger Trainingsprozesse zu steigern. Zudem gab Cursor bekannt, gemeinsam mit SpaceXAI ein noch leistungsstärkeres Nachfolgemodell von Grund auf zu trainieren; dafür wird die zehnfache Rechenkapazität von Composer 2,5 benötigt, die durch eine Million H100-GPUs im Colossus 2-Cluster bereitgestellt wird.