AWS lance une nouvelle génération d'OpenSearch Serverless conçu pour le trafic des agents IA ; Cloudflare affirme que le trafic non-humain dépassera le trafic humain au premier semestre 2027

Amazon Web Services (AWS) a dévoilé le 28 mai une nouvelle génération d’Amazon OpenSearch Serverless, dissociant totalement le calcul du stockage : lorsque les agents déclenchent des tâches, les ressources de calcul peuvent être mises à l’échelle en quelques secondes, et se réduisent automatiquement à zéro lorsqu’elles sont inactives, ce qui interrompt la facturation — alors qu’auparavant, même l’ancienne version Serverless nécessitait le maintien en fonctionnement d’au moins une instance en continu. Tia White, directrice générale d’AWS OpenSearch, a déclaré à TechCrunch que les agents créent des pics de trafic sans avertissement et retombent soudainement dans le silence : « Les entreprises ont besoin d’un système de recherche qui puisse suivre le rythme, sans avoir à payer en permanence pour des capacités de calcul inutilisées. » La nouvelle version intégrera nativement des plateformes de développement d’IA comme Vercel et Kiro, permettant aux développeurs de déployer des backends de recherche et de bases de données vectorielles prêts pour la production pour leurs agents, sans avoir à gérer l’infrastructure sous-jacente. Dans le même article, Lai Yi Ohlsen, responsable de produit senior chez Cloudflare, a révélé qu’au cours des six derniers mois, le trafic robotisé représentait 31 % de tout le trafic HTTP, dont les robots d’IA, les moteurs de recherche et les assistants constituaient environ un quart de toutes les requêtes robotisées, et a prédit que « le trafic non humain dépassera le trafic humain au premier semestre 2027 ».

Cette publication d’AWS reflète un changement systémique dans l’ensemble du secteur du cloud : Databricks et Snowflake se positionnent comme les systèmes de mémoire et de récupération des IA d’entreprise, Microsoft a déjà lancé des mises à jour Azure pour les pics soudains de trafic des agents d’IA et le partage de mémoire entre agents, et Cloudflare a également publié le mois dernier un produit d’infrastructure offrant des environnements persistants et une mise à l’échelle élastique instantanée pour les agents. L’article de TechCrunch souligne l’existence d’une boucle vertueuse entre la reconstruction de l’infrastructure et l’ampleur du déploiement des agents : de plus en plus d’entreprises utilisent des agents pour des scénarios internes et externes, ce qui accélère la refonte de l’infrastructure cloud pour le trafic machine, et cette amélioration de l’infrastructure réduit encore davantage les coûts et les barrières de déploiement des agents.

TechCrunch