أطلقت KVCache.ai أداة مفتوحة المصدر تعمل عبر المتصفح لحساب استهلاك ذاكرة الفيديو من بيانات KV، وتدعم نماذج رئيسية مثل DeepSeek V4 Flash وQwen3 وGLM وKimi وMiniMax. تتيح الأداة حساب الحجم المطلوب من الذاكرة بشكل فوري بناءً على طول السياق والدقة المستخدمة (مثل FP16 أو INT4) وحجم الدفعة. لاقت الأداة اهتمامًا كبيرًا في المجتمع التقني بعد إطلاقها؛ فعلى سبيل المثال، عند معالجة سياق طوله مليون token، يبلغ إجمالي استهلاك ذاكرة KV لنموذج DeepSeek V4 Flash حوالي 2.893 جيجابايت، بينما يحتاج نموذج MiniMax إلى نحو 236 جيجابايت تحت نفس الظروف، أي بفارق يقارب 82 مرة. يكمن السبب الرئيسي في ذلك في هيكلية الاهتمام المحتمل المتعدد الرؤوس (MLA) التي يعتمد عليها DeepSeek، حيث يتم ضغط أزواج القيم والمفاتيح إلى متغيرات كامنة منخفضة الأبعاد لتقليل استهلاك الذاكرة، وهو ما يفسر أيضًا انخفاض أسعار خدمات التخزين المؤقت في واجهة برمجة تطبيقات DeepSeek. وقد غرد المستخدم @teortaxesTex على منصة X قائلًا إن هذه الأداة «أخيرًا تم تطويرها، وهي توضح بجلاء الأسباب وراء تسعير خدمات التخزين المؤقت في DeepSeek»؛ كما استنتج مستخدمون آخرون أن إطلاق DeepSeek لنموذج يدعم سياقًا طوله 10 ملايين token هذا العام سيكون قرارًا اقتصاديًا سليمًا.
الموضوعات ذات الصلة
| الموضوع | الردود | مرات العرض | النشاط | |
|---|---|---|---|---|
| DeepSeek-V4-Pro 限时折扣 5 月 31 日到期,官方宣布原价四分之一将成永久定价 | 0 | 5 | 22 مايو 2026 | |
| 微软考虑以 DeepSeek V4 替换 Copilot Cowork 底层模型,Fable 5 同等 Token 成本高出 50 倍 | 0 | 2 | 17 يونيو 2026 | |
| DeepSeek API 更新限速文档,V4 Pro 并发上限 500、Flash 上限 2500 | 0 | 11 | 21 مايو 2026 | |
| 阿里巴巴发布闭源模型 Qwen3.7-Max,加大强化学习算力投入 | 0 | 15 | 21 مايو 2026 | |
| MiniMax M3 发布:MSA架构实现1M超长上下文,Coding与多模态能力进入国际前沿 | 0 | 6 | 1 يونيو 2026 |