أداة KVCache.ai مفتوحة المصدر تُظهر بوضوح استهلاك ذاكرة التخزين المؤقت KV في النماذج اللغوية الكبيرة؛ حيث يحتاج DeepSeek V4 Flash إلى 2.9 جيجابايت فقط لتخزين مليون توكن.

أطلقت KVCache.ai أداة مفتوحة المصدر تعمل عبر المتصفح لحساب استهلاك ذاكرة الفيديو من بيانات KV، وتدعم نماذج رئيسية مثل DeepSeek V4 Flash وQwen3 وGLM وKimi وMiniMax. تتيح الأداة حساب الحجم المطلوب من الذاكرة بشكل فوري بناءً على طول السياق والدقة المستخدمة (مثل FP16 أو INT4) وحجم الدفعة. لاقت الأداة اهتمامًا كبيرًا في المجتمع التقني بعد إطلاقها؛ فعلى سبيل المثال، عند معالجة سياق طوله مليون token، يبلغ إجمالي استهلاك ذاكرة KV لنموذج DeepSeek V4 Flash حوالي 2.893 جيجابايت، بينما يحتاج نموذج MiniMax إلى نحو 236 جيجابايت تحت نفس الظروف، أي بفارق يقارب 82 مرة. يكمن السبب الرئيسي في ذلك في هيكلية الاهتمام المحتمل المتعدد الرؤوس (MLA) التي يعتمد عليها DeepSeek، حيث يتم ضغط أزواج القيم والمفاتيح إلى متغيرات كامنة منخفضة الأبعاد لتقليل استهلاك الذاكرة، وهو ما يفسر أيضًا انخفاض أسعار خدمات التخزين المؤقت في واجهة برمجة تطبيقات DeepSeek. وقد غرد المستخدم @teortaxesTex على منصة X قائلًا إن هذه الأداة «أخيرًا تم تطويرها، وهي توضح بجلاء الأسباب وراء تسعير خدمات التخزين المؤقت في DeepSeek»؛ كما استنتج مستخدمون آخرون أن إطلاق DeepSeek لنموذج يدعم سياقًا طوله 10 ملايين token هذا العام سيكون قرارًا اقتصاديًا سليمًا.

X (@teortaxesTex) | KVCache.ai