跳转至内容
  • 0 赞同
    1 帖子
    1 浏览
    R
    据《金融时报》援引知情人士报道,华为基于已收到的订单预计其 2026 年 AI 芯片收入将达约 120 亿美元,较 2025 年的 75 亿美元增长逾 60%。核心催化剂是 DeepSeek V4 于 4 月 24 日发布——该模型经针对华为硬件优化并在 Ascend 950 系列上完成训练,华为随即宣布整个 Ascend SuperNode 产品线全面支持 DeepSeek V4,阿里巴巴、字节跳动、腾讯等中国互联网巨头随后密集下单。本年度绝大多数订单集中于最新款 Ascend 950PR,该芯片由中芯国际 N+3 工艺制造,3 月进入量产,分析师估计其性能介于英伟达 H100 与 H200 之间;华为目标全年出货 75 万颗,全面放量预计在下半年。此外,华为计划在第四季度推出 Ascend 950DT 升级版。DeepSeek 亦预告,随着 950PR 产能扩张,V4-Pro 价格有望在 2026 年下半年进一步下降。 此轮增长直接折射出中国 AI 基础设施市场的深层结构性变化。TrendForce 预测中国高端 AI 芯片市场 2026 年整体增长逾 60%,国产芯片有望占据约一半份额。与此同时,出口管制对供给端构成持续约束——先进制程光刻设备的禁运使中芯国际扩产受限,需求远超产能的局面已推动 Ascend 950 系列芯片价格上涨约 20%。路透社表示暂未独立核实 FT 报道,当前数字为基于订单的预测而非已确认收入。英伟达方面,其 H20 芯片此前亦遭美国政府限制对华出口,进一步加速了中国科技企业转向国产替代的节奏。 FT | Reuters | Yahoo Finance https://www.reuters.com/world/china/huawei-expects-ai-chip-revenue-jump-least-60-this-year-ft-reports-2026-05-01/ https://finance.yahoo.com/sectors/technology/articles/huawei-expects-ai-chip-revenue-005107401.html​​​​​​​​​​​​​​​​
  • 0 赞同
    1 帖子
    9 浏览
    R
    DeepSeek 4 月 30 日在 GitHub 发布技术报告《Thinking with Visual Primitives》,提出一种新的多模态推理范式——不再依赖纯文字描述或更高分辨率图像,而是在模型的推理轨迹中直接嵌入空间标记(点坐标与边界框)作为"最小思维单元",以此弥合所谓"Reference Gap":自然语言在描述密集空间布局时固有的歧义性,往往导致模型在推理过程中出现逻辑崩塌与幻觉。类比人类用手指逐个数数或在迷宫中用指尖描绘路径,该框架让模型"边指边推理",将抽象语言概念锚定到具体物理坐标。模型底层架构基于 DeepSeek-V4-Flash,将每 4 个视觉 token 的 KV Cache 压缩为单一条目,大幅降低图像 token 消耗;在计数与空间推理基准上,该紧凑规模模型的得分与 GPT-5.4、Claude Sonnet 4.6、Gemini 3 Flash 相当——团队特别注明这些分数仅覆盖与本研究直接相关的维度子集,不代表模型的整体能力。 模型权重将在未来整合进 DeepSeek 基础模型后一并开源,近期计划先公开内部基准与部分冷启动数据;代码以 MIT 许可证授权。这是 DeepSeek 在 V4 发布后一周内首次正式披露多模态方向的技术进展,也与此前社区观察到识图模式(Vision)灰度上线相互印证——尽管二者聚焦层面不同,本报告更偏向"推理时空间锚定机制"这一基础研究课题。 GitHub - deepseek-ai/Thinking-with-Visual-Primitives https://github.com/deepseek-ai/Thinking-with-Visual-Primitives
  • 0 赞同
    1 帖子
    13 浏览
    R
    GitHub 明星数达 36.3 万、全球最受关注的开源 AI Agent 框架 OpenClaw 于 4 月 24 日发布新版本,正式将 DeepSeek V4 Flash 设为默认大模型,同时上线 V4 Pro 供用户切换——意味着全球每个更新 OpenClaw 的用户,开启对话时底层默认调用的已是 DeepSeek V4 Flash。新版本同步修复了 DeepSeek 在多轮工具调用中 thinking 与 replay 的行为问题,补齐 reasoning_content 缺失时的占位逻辑,提升长链路 Agent 任务的稳定性。此外,OpenAI gpt-image-2 图像生成与参考图编辑功能通过 Codex OAuth 打通,无需额外 OPENAI_API_KEY;OpenRouter 侧同步支持 image_generate 工具。 功能扩展方面,Google Meet 被内置为 bundled participant plugin,支持个人 Google 账号授权、Chrome 与 Twilio 实时音频传输、麦克风权限处理与标签页复用,会议结束后可自动导出转写内容、智能笔记与参会人会话记录为 Markdown 文件;Voice Call 与 Talk 也同步支持实时语音调用完整 OpenClaw Agent,电话中的问题可经由 openclaw_agent_consult 交后台 Agent 处理后以语音返回。浏览器自动化新增 viewport 坐标点击作为控件识别的兜底方案,默认 action budget 延长至 60 秒。架构层面,模型目录改为从 manifest 静态加载,减少启动时枚举开销,并移除旧版 Pi-only 的 api.registerEmbeddedExtensionFactory 接口,要求插件开发者迁移至 api.registerAgentToolResultMiddleware。 GitHub - openclaw/openclaw | 新浪财经 https://github.com/openclaw/openclaw/releases
  • 0 赞同
    1 帖子
    18 浏览
    R
    DeepSeek 官方 API 定价页更新,V4-Pro 限时 2.5 折优惠期由原定 5 月 5 日延长至北京时间 2026 年 5 月 31 日 23:59;同时标注全系列模型缓存命中输入价格降至首发价 1/10 的调整自 4 月 26 日 20:15 起生效。两款新模型 deepseek-v4-flash 与 deepseek-v4-pro 上下文长度统一为 1M、最大输出 384K,均支持非思考与思考模式切换;JSON Output、Tool Calls 与对话前缀续写均支持,FIM 补全仅非思考模式支持。V4 同时提供 OpenAI 格式(https://api.deepseek.com)与 Anthropic 格式(https://api.deepseek.com/anthropic)两条入口。 价格上,V4-Flash 每百万 token 输入 0.02 元(缓存命中)/1 元(缓存未命中)、输出 2 元;V4-Pro 原价分别为 0.1 元、12 元、24 元,2.5 折后实际单价为 0.025 元、3 元、6 元。旧模型名 deepseek-chat 与 deepseek-reasoner 标注"于日后弃用",过渡期内分别对应 V4-Flash 的非思考与思考模式,具体下线日期暂未给出。 DeepSeek API Docs | DeepSeek V4 发布公告 https://api-docs.deepseek.com/zh-cn/quick_start/pricing/ https://api-docs.deepseek.com/zh-cn/news/news260424/
  • 0 赞同
    1 帖子
    19 浏览
    R
    DeepSeek 于 4 月 24 日发布并同步开源 V4 预览版,分为 V4-Pro(1.6T 总参数、49B 激活)与 V4-Flash(284B 总参数、13B 激活)两档,均为 MoE 架构并原生支持 100 万(1M)token 上下文。官方称 V4-Pro 在 Agentic Coding 评测中达到当前开源模型最佳水平,已被 DeepSeek 内部用作日常 Agentic Coding 主力,反馈使用体验优于 Claude Sonnet 4.5、交付质量接近 Opus 4.6 非思考模式,仍落后于 Opus 4.6 思考模式;世界知识仅稍逊于 Gemini-Pro-3.1;数学、竞赛代码评测超越所有已公开评测的开源模型,Codeforces 评分 3206 高于 GPT-5.4。V4-Flash 推理能力接近 Pro 版但更快更经济,简单 Agent 任务与 Pro 版相当、复杂任务仍有差距。 技术上 V4 提出 token 维度压缩注意力机制并结合 DSA 稀疏注意力(DeepSeek Sparse Attention),官方称在 1M 上下文下 V4-Pro 单 token 推理 FLOPs 仅为 V3.2 的 27%、KV Cache 仅为 10%。API 层面 base_url 不变,model 改为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用,同时支持 OpenAI ChatCompletions 与 Anthropic 双协议;定价上 V4-Pro 每百万 token 输出 24 元、V4-Flash 输出 2 元,远低于同档闭源模型。原有的 deepseek-chat 与 deepseek-reasoner 两个旧模型名将于 2026 年 7 月 24 日下线,当前分别指向 V4-Flash 的非思考与思考模式。本次发布与 OpenAI 的 GPT-5.5 选择同日上线,权重与技术报告均已在 HuggingFace、ModelScope 同步开源。 DeepSeek API Docs | IT之家 | 36氪 | 观察者网
  • 0 赞同
    1 帖子
    13 浏览
    R
    长期坚持不引入外部资金的中国AI新创企业DeepSeek,近日首次启动对外融资,目标估值已从最初100亿美元一路攀升至逾200亿美元。据《The Information》报道,腾讯与阿里巴巴正积极参与投资谈判。 此次融资转变背后,是DeepSeek面临的多重压力:核心研究人员相继被国内大厂高薪挖走,新一代旗艦模型V4屡遭推迟,算力成本持续攀升。外部资金将主要用于扩充算力资源与稳定技术团队。 对腾讯与阿里而言,入股DeepSeek兼具防御与进攻双重战略意义,既可对冲自研大模型风险,也能开辟深度技术合作通道。目前谈判仍在进行中,最终估值与融资规模尚未确定。 [image: 1a1021cb-4438-45ec-a443-8c16fcacf321.jpeg]