أداة KVCache.ai مفتوحة المصدر تُظهر بوضوح استهلاك ذاكرة التخزين المؤقت KV في النماذج اللغوية الكبيرة؛ حيث يحتاج DeepSeek V4 Flash إلى 2.9 جيجابايت فقط لتخزين مليون توكن.

ref · 22 مايو 2026، 5:11م

أطلقت KVCache.ai أداة مفتوحة المصدر تعمل عبر المتصفح لحساب استهلاك ذاكرة الفيديو من بيانات KV، وتدعم نماذج رئيسية مثل DeepSeek V4 Flash وQwen3 وGLM وKimi وMiniMax. تتيح الأداة حساب الحجم المطلوب من الذاكرة بشكل فوري بناءً على طول السياق والدقة المستخدمة (مثل FP16 أو INT4) وحجم الدفعة. لاقت الأداة اهتمامًا كبيرًا في المجتمع التقني بعد إطلاقها؛ فعلى سبيل المثال، عند معالجة سياق طوله مليون token، يبلغ إجمالي استهلاك ذاكرة KV لنموذج DeepSeek V4 Flash حوالي 2.893 جيجابايت، بينما يحتاج نموذج MiniMax إلى نحو 236 جيجابايت تحت نفس الظروف، أي بفارق يقارب 82 مرة. يكمن السبب الرئيسي في ذلك في هيكلية الاهتمام المحتمل المتعدد الرؤوس (MLA) التي يعتمد عليها DeepSeek، حيث يتم ضغط أزواج القيم والمفاتيح إلى متغيرات كامنة منخفضة الأبعاد لتقليل استهلاك الذاكرة، وهو ما يفسر أيضًا انخفاض أسعار خدمات التخزين المؤقت في واجهة برمجة تطبيقات DeepSeek. وقد غرد المستخدم @teortaxesTex على منصة X قائلًا إن هذه الأداة «أخيرًا تم تطويرها، وهي توضح بجلاء الأسباب وراء تسعير خدمات التخزين المؤقت في DeepSeek»؛ كما استنتج مستخدمون آخرون أن إطلاق DeepSeek لنموذج يدعم سياقًا طوله 10 ملايين token هذا العام سيكون قرارًا اقتصاديًا سليمًا.

X (@teortaxesTex) | KVCache.ai

الموضوع	الردود	مرات العرض
DeepSeek-V4-Pro 限时折扣 5 月 31 日到期，官方宣布原价四分之一将成永久定价常规 ai , deepseek , api , deepseek-v4 , 定价	5	22 مايو 2026
微软考虑以 DeepSeek V4 替换 Copilot Cowork 底层模型，Fable 5 同等 Token 成本高出 50 倍常规 deepseek , microsoft	2	17 يونيو 2026
DeepSeek API 更新限速文档，V4 Pro 并发上限 500、Flash 上限 2500 常规 ai , 限速 , deepseek , api	11	21 مايو 2026
阿里巴巴发布闭源模型 Qwen3.7-Max，加大强化学习算力投入常规 ai , 大模型 , 阿里巴巴 , qwen , 强化学习	15	21 مايو 2026
MiniMax M3 发布：MSA架构实现1M超长上下文，Coding与多模态能力进入国际前沿常规 ai , 大模型 , coding , minimax	6	1 يونيو 2026

أداة KVCache.ai مفتوحة المصدر تُظهر بوضوح استهلاك ذاكرة التخزين المؤقت KV في النماذج اللغوية الكبيرة؛ حيث يحتاج DeepSeek V4 Flash إلى 2.9 جيجابايت فقط لتخزين مليون توكن.

الموضوعات ذات الصلة