DeepSeek 网页版近期向部分用户灰度推送新版交互,对话入口处显式呈现三种模式选择:快速模式(Fast)、专家模式(Expert)与识图模式(Vision),其中 Vision 模式带独立 logo,输入框内提示"使用识图模式开始对话"。这与 4 月 8 日 TechNode 援引早期测试界面截图的描述完全吻合,并将此前社区对"V4 Lite(Fast)+ V4(Expert)+ V4 Vision"三档拆分的猜测从传闻升级为已可见的事实。北京大学研究员 PKUCXK(陈晓康)4 月 28 日在 X 发帖暗示"DeepSeek vision coming",r/LocalLLaMA 迅速跟进讨论,普遍认为这是 DeepSeek 在为多模态版本的正式公告做预热。
值得关注的是,DeepSeek V4 于 4 月 23 日发布并开源时仅支持纯文本,官方公告明确"正在为模型加入多模态能力"。据 36 氪旗下"AI 涌现"援引知情人士披露,多模态训练之所以未能与 V4 主版本同步交付,主因是算力与现金流约束——公司外部融资窗口于 4 月中旬刚刚开启,需要更多资金训练更大参数规模的模型并保留/招募顶尖人才。该报道亦援引澎湃新闻 4 月 28 日的盘点,称 DeepSeek 在基础大语言模型、Agent、OCR、多模态等方向均失去核心贡献者,分别被腾讯、字节跳动、小米、DeepRoute 等挖走。从灰度上线节奏判断,识图模式正式发布料在数日至数周内。
PKUCXK on X | Reddit r/LocalLLaMA | TechNode
https://technode.com/2026/04/08/deepseek-v4-may-launch-this-month-test-interface-suggests-vision-and-expert-modes/