Claude Code lance un mode rapide : Opus 4.6 est désormais 2,5 fois plus rapide

Anthropic a dévoilé en version préliminaire de recherche le « Fast Mode » dans la documentation de Claude Code : il s’agit d’une configuration API haute vitesse réservée à Claude Opus 4.6. Ce mode permet d’obtenir des réponses 2,5 fois plus rapides qu’en mode standard, mais le coût par token est plus élevé. Il ne s’agit pas d’un nouveau modèle ; la qualité et les capacités d’Opus 4.6 restent inchangées, seule la configuration API privilégie désormais une faible latence. Le tarif est fixé à 30 dollars par million de tokens entrants et à 150 dollars par million de tokens sortants. Tous les abonnés aux plans Pro, Max, Team et Enterprise peuvent l’utiliser, mais cette consommation est comptabilisée dans la rubrique « usage supplémentaire » sans impacter les quotas inclus dans leurs abonnements. Pour l’activer, il suffit de saisir « /fast » dans l’interface CLI de Claude Code ou dans le plugin VS Code ; une fois activé, le symbole « ↯ » apparaît à côté du prompt. On peut également le mettre en place en permanence en ajoutant « “fastMode”: true » dans son fichier de configuration.

En cas de dépassement des limites de taux de requêtes, le système bascule automatiquement vers le mode Opus 4.6 standard : l’icône devient alors grise et revient à la normale après expiration du délai de mise en attente. Le Fast Mode n’est pas compatible avec les plateformes cloud tierces telles qu’Amazon Bedrock, Google Vertex AI ou Microsoft Azure Foundry ; il nécessite au minimum la version 2.1.36 de Claude Code. Pour les organisations Teams et Enterprise, ce mode est désactivé par défaut : les administrateurs doivent le activer manuellement et peuvent paramétrer « fastModePerSessionOptIn » afin d’exiger une réactivation à chaque session, ce qui permet de mieux maîtriser les coûts. L’éditeur précise que cette fonctionnalité est encore en phase de prévisualisation de recherche, et que ses tarifs ainsi que sa disponibilité pourraient évoluer selon les retours utilisateurs. Enfin, comme l’activation tardive du Fast Mode entraîne un recalcul du prix de l’ensemble du contexte de conversation selon ce mode, il est recommandé de l’activer dès le début de chaque session pour optimiser les coûts.

Documentation Claude Code