百家乐app DeepSeek“发牌”，新一轮token价钱战打什么

发布日期：2026-05-01 19:05 点击次数：190

畅达两次降价后，DeepSeek 又在 4 月 28 日将限时优惠延迟至 5 月 31 日。

4 月的临了一个周末，DeepSeek 先对 DeepSeek-V4-Pro（以下简称" V4-Pro "）限时 2.5 折，再将全系列模子，输入缓存掷中的价钱降至首发价钱的 1/10。即在促销时间，V4-Pro 输入缓存掷中价钱从 1 元 / 百万 tokens 跌至 0.025 元 / 百万 tokens。

此前，国内 AI 行业正处在加价周期，大模子公司智谱三度提价，月之暗面新模子的输入和输出价钱不同经过飞腾，云厂商也动作一致，百度智能云、腾讯云、阿里云调价，意义是团结套：民众算力需求激增，硬件成本飞腾。

昔日一年，大模子从"价钱战"打到"加价潮"，没东谈主确切赚到钱，营收和净蚀本都涨。DeepSeek 用 0.025 元抛出了一个问题，当推理成本不错被合手续压缩，大模子公司的护城河，究竟是更低廉的 token，如故更不行替代的价值？

逆行者

DeepSeek 的降价来得低调，但并不含蓄。

4 月 24 日，DeepSeek 全新系列模子 DeepSeek-V4 的预览版块细腻上线并同步开源。该模子按大小分为两个版块：V4-Pro 参数较大，1.6T；V4-flash 参数 284B。两个版块支合手的高下文长度都是 100 万。"从当今驱动，1M（100 万）高下文将是 DeepSeek 所有官方作事的标配"，DeepSeek 独特加粗强调。

今日，DeepSeek 公布了两个版块模子的价钱，V4-Pro 输入（缓存掷中）价钱 1 元 / 百万 tokens，输入（缓存未掷中）价钱 12 元 / 百万 tokens，输出价 24 元 / 百万 tokens。一样情况下，V4-flash 的价钱分歧是 0.2 元 / 百万 tokens、1 元 / 百万 tokens 和 2 元 / 百万 tokens。

次日，降价驱动，且不啻一次。

4 月 25 日，DeepSeek 开启 V4-Pro 模子的限时特惠行动，API 价钱享受 2.5 折优惠，优惠期限至 5 月 5 日。4 月 26 日，DeepSeek 全系列模子输入缓存掷中的价钱降到原价的 1/10。

DeepSeek 揣摸员陈德里在应付平台提示，"输入缓存（掷中）的扣头是永远的，扣头促销行动将合手续到 5 月 5 日"。

4 月 28 日，DeepSeek 又将 V4-Pro 的 2.5 折限时优惠，从 5 月 5 日延迟至 5 月 31 日。

按此盘算，在 5 月 31 日之前，V4-Pro 模子百万 tokens 的输入（缓存掷中）价钱从原本的 1 元降到了 0.025 元。5 月 31 日之后，也只好 0.1 元。这是 DeepSeek 这波降价行动中，扣头幅度最大的一项。

何为缓存掷中，与缓存未掷中有什么区别？

一位头部云厂商工程师向北京商报记者诠释，"草率说，缓存掷中是指模子‘铭刻’你之前问过近似的实质，不错奏凯调用缅思回答不参与推理，收费低廉。缓存未掷中违反，意义是模子第一次见这个实质，需要从新算一遍，百家乐是以收费贵"。

成本阛阓快速响应。4 月 27 日，即 DeepSeek 降价后的第一个交游日，智谱和 MiniMax 的股价出现不同经过下滑。

0.025 元的支合手

这个价钱不是杜撰出现的。

左证官方工夫解读，DeepSeek-V4 草创了一种全新的看重力机制，在 token 维度进行压缩，联结 DSA 疏淡看重力（DeepSeek Sparse Attention），结束了民众最初的长高下文身手，何况比较于传统行动大幅缩小了对盘算和显存的需求。

这与外部不雅察一致。CHIP 中国实际室主任罗国昭向北京商报记者分析称，DeepSeek V4 降价"更猛经过上跟模子算法优化、同等性能的算力耗尽缩小筹商，和定位一样的大模子比较，V4 的上风是在更多参数、更高性能情况下的更廉价钱"。他也谈及硬件成本，但强调"与采购国产芯片只好宏不雅的筹商性，莫得奏凯和及时的关联"。

另一家大模子厂商从业者楚清（假名）则提供了另一种诠释："看上去是 DeepSeek 在全栈适配国产算力方面最初，是以勇于定廉价"。他的不雅点迷惑在 DeepSeek 模子价位表下的一滑小字："受限于高端算力，目下 Pro 的作事婉曲特地有限，展望下半年昇腾 950 超节点批量上市后，V4-Pro 的价钱会大幅下调"。

一个值得看重的插曲是，4 月 24 日也便是 DeepSeek 模子上新今日，华为盘算告示：昇腾一直同步支合手 DeepSeek 系列模子，本次通过两边芯模工夫细致协同，结束昇腾超节点全系列居品支合手 DeepSeek V4 系列模子。

DeepSeek 也将华为昇腾和英伟达一都写进 DeepSeek-V4 工夫论说："咱们在英伟达 GPU 和华为昇腾 NPU 平台上考据了细粒度 EP（巨匠并行）决议。"

4 月 28 日，摩根士丹利亚太揣摸团队发布的最新行业论说《China's AI Path: More Bang For The Buck》也提到，中国模子的"性价比"上风和洽体当今：以好意思国同业 15% — 20% 的推理成本结束同等智能水平。论说将工程效果擢升归因于三大标的：架构层面的庞大模子与 MoE、看重力机制立异；后查验层面的强化学习与模子蒸馏，以及推理基建层面的硬件优化与 KV cache（一种缓存机制）效果。新近发布的 DeepSeek-V4 被视为最新例证。

谁会接招

不外，摩根士丹利如故大幅上调中国两大前沿 AI 公司主义价，其中，MiniMax 主义价由 990 港元上调至 1100 港元，行业评级看守" In-Line "，并明确预期，MiniMax 在 M3 模子升级后将启动关键价钱上调，这或成为下一阶段 ARR（司帐收益率）催化剂。

从企业层面看，DeepSeek 的降价暂时莫得等来同业跟进。

4 月 28 日，北京商报记者就会否跟进降价，采访了智谱、MiniMax、百度智能云、阿里云、腾讯云，遗弃发稿，以上几家公司筹商东谈主士均未恢复。

楚清从工夫层面诠释了这种分化的原因："其他公司要是莫得和国产算力提前优化适配的话，短期内成本降不下来。"

文渊智库首创东谈主王超的判断更聚焦于价钱本人的长久趋势：" token 降价是工夫的越过，不然不行能结束。最近不管是算力、token、芯片、内存的价钱都在飞腾，处在一个小周期飞腾的阶段，但大周期细则是要下落的。"

手脚智能体赛谈的一员，猎豹迁移董事长兼 CEO 傅盛更眷注另一条旅途的可能性。

他在试用 V4 系列模子后以为，" V4 把国产 AI 大模子，无论开源如故闭源的性能又提高到一个更高的水平，直逼民众最强模子。天然还有 3 — 6 个月差距，但仍是豪阔好用了。更伏击的是，DeepSeek 可能正在引颈国产 AI 走出一条和好意思国 AI 不同的谈路"。

这些判断并不矛盾，DeepSeek 用工夫降本考据大周期下落的标的，而智谱、MiniMax 们在用加价对冲小周期飞腾的压力，但从业者都昭彰中枢护城河一定不仅仅价钱这一单孑然分，DeepSeek 仍是给出了它的谜底，但行业还在千里默中恭候更多东谈主表态。

北京商报记者魏蔚滚球app中国官网下载入口百家乐app