DeepSeek降价核心细节
1. 具体价格调整
- 输入(缓存命中):从原价0.1元降至0.025元/百万Tokens(降幅97.5%);
- 输入(缓存未命中):从12元降至3元/百万Tokens(降幅75%);
- 输出:从24元降至6元/百万Tokens(降幅75%)。
- 对比国际竞品:输出成本仅为GPT-5.5的1/36(OpenAI定价约216元/百万Tokens),Claude Opus的1/25。
2. 调价历史脉络
- 4月25日:V4-Pro开启2.5折限时优惠(原定5月5日截止);
- 4月26日:全系模型输入缓存命中价永久降至首发价1/10;
- 4月28日:2.5折优惠延长至5月31日;
- 5月22日:宣布5月31日后永久维持2.5折价格,不再恢复原价。
DeepSeek降价的核心动因
1. 技术突破压缩成本
- 推理效率跃升:V4-Pro采用Engram稀疏注意力架构,单次推理算力消耗降至前代V3.2的27%,缓存显存占用仅为1/10,直接推动单位Token成本下降。
- 国产算力适配:模型已完成华为昇腾950芯片深度优化,在国产算力集群上推理速度提升35倍,摆脱对英伟达GPU的依赖,显著降低算力采购成本。
2. 战略融资支撑长期投入
- 创始人梁文锋正推进700亿元人民币(约100亿美元)首轮融资,投前估值约450亿美元,若落地将创中国科技初创企业首轮融资纪录。
- 梁文锋个人拟出资200亿元(占融资总额28%以上),并承诺技术优先于短期变现,确保降价策略可持续。
3. 抢占Agent时代生态入口
- 低价策略旨在吸引开发者快速构建基于DeepSeek的AI应用生态,尤其针对高频调用场景(如RAG知识库、智能客服),缓存命中率超90%的场景成本降幅可达97.5%。
- 通过“以价换量”加速模型迭代,形成“用户增长→数据反馈→性能优化→成本再降”的正向循环。
DeepSeek行业影响与用户价值
1. 对开发者的直接利好
- 高频调用场景成本断崖式下降:
- 企业知识库长文本查询(缓存命中率80%+),单次百万Token处理成本从56元降至12.8元;
- AI编程智能体(缓存命中率95%+),月调用1亿Tokens成本从1295元降至302元。
- 创业门槛大幅降低:中小团队可免费试错复杂AI应用,无需担忧API调用费用失控。
2. 行业竞争格局重构
- 中小模型厂商承压:若跟随降价将面临亏损,不降价则丧失价格竞争力,行业加速洗牌;
- 海外巨头被动应对:OpenAI等高价策略受挑战,全球大模型定价基准被拉低一个数量级;
- 国产算力生态强化:降价依赖昇腾等国产芯片支持,推动“模型-算力”自主可控闭环。
3. 需注意的限制条件
- 并发调用上限:V4-Pro模型API设置2500并发限制,超限返回429错误,主要针对反代薅羊毛行为,正常开发者影响有限;
- 免费服务不受影响:DeepSeek官网及App仍保持免费,降价仅涉及API调用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...




