The Battle of Titans Amidst a $10 Billion Surge: The Two Distinct Paths of DeepSeek and Dark Side of the Moon
36Kr
祝卿安
百亿美元涌入下的双雄博弈:DeepSeek与月之暗面的两种“活法”新博弈·2026年05月13日 20:45开源共识下的路线分野,基础设施与能力服务的估值岔口月之暗面D轮北京市2023-04AI初创大模型公司36氪报道前沿技术我要联系 5月7日与8日,中国大模型行业在48小时内密集释放了逾百亿美元的融资信号。 月之暗面率先宣布完成约20亿美元的新一轮融资,投后估值突破200亿美元(约1358亿人
百亿美元涌入下的双雄博弈:DeepSeek与月之暗面的两种“活法”新博弈·2026年05月13日 20:45开源共识下的路线分野,基础设施与能力服务的估值岔口月之暗面D轮北京市2023-04AI初创大模型公司36氪报道前沿技术我要联系
5月7日与8日,中国大模型行业在48小时内密集释放了逾百亿美元的融资信号。
月之暗面率先宣布完成约20亿美元的新一轮融资,投后估值突破200亿美元(约1358亿人民币)。仅隔一天,消息人士向多家媒体透露,DeepSeek正在推进成立以来首次外部股权融资,目标规模最高达500亿元人民币(约73亿美元)。若这一国内人工智能企业史上规模最大的单轮融资成功落地,DeepSeek估值或直指3500亿元(515亿美元)。
同期,阶跃星辰近25亿美元的融资消息也在市场上快速发酵,三笔融资合计将这一波资本浪潮推至百亿美元量级。
五年前,中国AI创业公司的估值坐标还局限在“百亿人民币俱乐部”的范畴内,如今千亿级人民币已成为头部玩家的基本刻度。DeepSeek和月之暗面的融资能真正构成行业分水岭,不仅在于金额本身,也源于它们揭示了两种截然不同的生存路径。
月之暗面走的是典型的高融资、快速商业化、全球扩张路线:成立两年多以来,累计融资已超过376亿元,为国内大模型创业公司之最,收入结构在过去半年间完成了从C端订阅主导到B端API驱动的结构性转换,海外收入在Kimi K2.5大模型上线后已全面反超国内。而DeepSeek走的则是一条从不融资、不商业化、不路演转向资本化运作的路径。
两笔融资折射出同一个深层信号,中国大模型的估值叙事正在从“技术理想”全面切换至“战略资产定价”。
在全球GPU管制持续收紧、开源社区下载量突破百亿次、产业资本深度介入的多重叠加之下,这两家公司站在了同一条分界线上。一侧是中国大模型能否真正跑通商业化闭环的市场考验,另一侧是算力自主化进程能否支撑万亿参数模型持续扩张的产业底线。它们的融资故事,正在共同重写中国AI竞争的价值锚点。
开源共识下的路线分野,基础设施与能力服务的估值岔口
2026年春季,DeepSeek与月之暗面在技术路线上截然不同的选择,直接塑造了资本市场对两家公司的估值逻辑。理解这一轮融资的核心,不在于参数的多少或跑分的座次,而在于两条技术路线各自指向了怎样的收入结构和成本模型,这正是投资人定价的底层框架。
DeepSeek V4预览版于4月24日上线并同步开源,以自研CSA+HCA混合注意力架构,将百万上下文算力需求压缩至前代的十分之一。上线次日,DeepSeek便宣布价格下调75%,V4-Flash低至0.0029美元/百万Token,这标志着大模型正式迈入百万token普惠智能时代。
这一连串数字揭示的估值叙事,是DeepSeek正在将自己定位为大模型基础设施层。开源意味着放弃模型层面的直接变现,极致降价意味着用规模换取生态绑定。
资本市场对这一模式的定价逻辑,对标的是操作系统或云平台,即开源模型免费铺开,API低价走量,最终依靠开发者的工具链依赖和企业级服务的增值空间来构建长期护城河。用户规模和调用量的增速,比短期营收数字更能支撑估值。
但“基础设施”这条路并非没有代价。开源意味着技术壁垒的持续消解,竞争对手可以基于开源模型进行蒸馏、微调甚至直接商用,DeepSeek要维持生态主导地位,就必须在模型迭代速度上始终保持领先,而每一次迭代背后都是巨额算力投入。
与此同时,极致低价的API策略虽然在用户获取端势如破竹,但单位毛利被压缩至极薄区间,规模效应能否覆盖固定成本仍是悬而未决的命题。
资本市场愿意为这种模式给出高估值,隐含的假设是,当开发者生态足够庞大之后,DeepSeek可以在工具链、企业级部署、垂直行业解决方案等增值服务中实现阶梯式变现。投资人赌的是“先圈地,后收割”的互联网经典剧本,在大模型赛道能够重演。
月之暗面的技术演进则指向了另一套估值坐标。Kimi K2.6模型发布后,公司一反此前降价策略,对API实施结构化提价:对缓存命中率高的企业客户影响较小,对散客涨幅明显。这一调价动作本身就是强烈的定价信号,即月之暗面正在从“卖模型”转向“卖能力”。
K2.6采用万亿参数MoE架构,384专家每token激活8个,搭载MLA注意力机制,在LMArena评测中位列全球开源模型代码能力与视觉能力第一。但真正支撑提价信心的,是其向Agent集群方向的跃迁,K2.6支持300个Agent集群协作,定位从单一对话模型转向复杂工程落地的多智能体调度系统。
这意味着模型的商业价值不再按token消耗计算,而是按解决复杂任务的“执行结果”定价。资本市场对这一模式的估值,参考的是企业级SaaS的溢价逻辑,客户为业务结果买单,模型能力越强、能替代的人工流程越多,定价空间越大。
但Agent集群的落地高度依赖企业客户的数字化基础和业务流程重构意愿,交付链条远长于单一API调用,烧钱速度远超纯模型公司。
由此来看,未来真正的估值分歧将出现在应用层和生态层。月之暗面K3已在规划2.5万亿参数规模的MoE架构,上下文长度标准将提升至约 100 万字,但受限于算力成本和运营支出,能否向用户全面开放仍悬而未决。DeepSeek则凭借国产算力适配带来的成本优势,在降价空间上握有更大主动权。
两种模式最终谁能在营收与成本之间找到最优平衡,是这一轮估值能否被二级市场接住的关键变量。
算力生态的竞合演进,从芯片适配到商业闭环
如今,全球大模型市场的格局正在经历一轮以“价值密度”为核心的结构性洗牌。Counterpoint Research数据显示,2026年第一季度,全球大语言模型 (LLM) 月活用户突破38亿,单季营收约207亿美元。
最值得注意的信号是,Anthropic以31.4%的市场份额力压OpenAI的29%登顶,而其月活用户仅为后者的不到七分之一,每用户月均收入高达16.20美元。这表明,规模已不再是估值的唯一标尺,能否在单位用户身上获取更高的商业回报,才是决定市场定价权的关键。
这一趋势同样投射在中国头部AI公司身上。投资人不再单纯为模型参数或用户规模买单,他们更加关注的是公司能否建立起可持续的算力成本效率和商业转化闭环。
4月初首度传出融资风声时,DeepSeek的估值约为100亿美元,仅过去一个月时间,这个数字就变为了515亿美元,估值暴涨背后,是DeepSeek率先跑通了一条“模型技术优化+国产算力适配”的产业闭环。V4系列模型在发布当日即完成与华为昇腾芯片的全栈适配,推理时延控制在10ms量级,这在万亿参数MoE模型上尚属首次。
更关键的是,这种适配不是实验室里的技术演示,而是直接支撑了推理成本的大幅下降,当竞争对手还在依赖英伟达高端GPU堆砌算力时,DeepSeek已经用国产芯片实现了同等甚至更优的经济模型。
对于一级市场投资者而言,这提供了两个极具吸引力的叙事支点。一是公司具备了在高性能芯片受限环境下的生存能力,二是其成本结构允许执行更激进的定价策略以抢夺市场份额。
据爆料,DeepSeek本轮融资中,国家集成电路产业投资基金拟领投。半导体领域投资方的入局,正是对这种模型与芯片协同生态的定价,它标志着算法公司与算力硬件公司之间形成了真正的商业合力。
月之暗面的算力战略则呈现出另一种产业整合思路。K2.6模型搭载万亿参数MoE架构,384专家每token激活8个,其对显存和推理资源的占用极为庞大。
公司此轮20亿美元融资由美团龙珠领投,中国移动、水木资本、CPE源峰等参投。中国移动作为国内运营商巨头,手握覆盖全国的算力网络和政企客户资源,其以战略投资者身份进入,意味着月之暗面正在将“模型能力+运营商算力网络”深度捆绑。这种合作模式直接服务于其B端扩展,具体来看,K2.6支持300个Agent集群协作,便对低时延、高稳定的算力调度有刚性需求。
同时,运营商资源的接入,不仅降低了其大规模Serving的边际成本,也为获取金融、制造、能源等行业大客户铺设了渠道。这本质上是通过产业资本连接,将算力成本、客户获取、服务交付融合成一个完整的商业链条。
将视线拉回全球坐标系,中国大模型公司的这一轮融资潮恰逢OpenAI估值叙事遭遇挑战的时刻。
软银原计划以OpenAI股权为抵押进行一笔100亿美元的贷款,但贷款方因难以厘定其合理估值,最终被迫削减至60亿美元。OpenAI在2025年营收约131亿美元,增速依然可观,但在编码及企业级市场的份额正被Anthropic逐步蚕食,ChatGPT网页端流量份额从一年前的约86%跌至2026年初的约64%。
这一现象揭示了一个残酷现实,即便是全球顶级AI公司,如果不能在核心商业场景中持续证明价值转化能力,高估值同样可能面临流动性折价。
对中国公司而言,DeepSeek凭借国产算力适配所实现的结构性成本优势,与月之暗面借助运营商生态构建的B端商业闭环,正是它们在这一轮估值跃升中试图交付给资本市场的核心答案。不是宏大叙事,而是产业层面实实在在的效率提升与商业回报预期。
商业化的平行答卷,营收高增速下的估值平衡术
在资本市场,高融资与高估值需要在营收层面找到对位锚点,否则便容易滑入“越大越不赚钱”的估值陷阱。两笔融资信息释放之后,市场最关切的问题始终指向同一个方向,3500亿元与1358亿元这两个估值数字,与两家公司目前的营收体量之间,究竟隔着多大的现实差距。
月之暗面的商业化进程更为透明。2026年1月上线的K2.5模型让公司收入结构发生了质变,模型上线后近20天内,公司累计收入便超过了2025年全年总和。ARR(年度经常性收入)在3月初首次突破1亿美元,并在4月进一步增长至2亿美元以上,付费订阅用户规模与API调用量均呈持续加速态势。
到2026年2月初,月之暗面在与投资人沟通中透露,海外收入已超过国内,K2.5发布后全球付费用户规模实现4倍增长。若以当前约2亿美元的ARR为基数,对应200亿美元的投后估值,其ARR倍数在100倍左右。
作为参考,OpenAI、Anthropic 等的估值倍数约为20至60 倍,考虑到月之暗面收入的高速增长率以及全球扩张的增量空间,市场在一定时间内给出了阶段性溢价。
DeepSeek的财务画像非常模糊,截至 2026 年 4 月,DeepSeek月活用户约为1.35亿,但目前外界尚不具备足够确切的营收数字。3500亿元估值背后的市场预期,是公司将在未来数年内实现营收的指数级增长,同时依托国产算力成本优势维持行业领先的利润率。一旦营收增速未能兑现这一预期,估值回调将不可避免。
目前来看,DeepSeek与月之暗面的两笔融资,正在共同完成对行业资本流向的虹吸效应。5月7日至8日两天内,月之暗面20亿美元、阶跃星辰近25亿美元、DeepSeek 500亿元人民币三笔融资集中浮出水面,中国大模型赛道密集释放逾百亿美元资金。
正如业界所观察到的,钱不是在流向行业,而是在流向最后几个玩家,集中度越高,留给后来者的空间越小。2026年Q1,中国AI领域的风险投资交易金额达2560亿元,同比增长高达52%,但在头部公司融资加速的同时,中间层模型公司正在经历最漫长的流动性寒冬。
这也意味着,行业竞争已从“谁能做出好模型”的比拼,转向了“谁能建立可持续商业闭环、谁能嵌入产业核心基础设施”的终极筛选。
近一个月来,市场频繁传出月之暗面即将IPO的消息,如果消息为真,对月之暗面而言,20亿美元融资完成后,它需要向市场证明200亿美元估值能够在IPO窗口期内获得二级市场的认可。对DeepSeek而言,500亿元首轮融资将定义其能否在全球大模型竞赛中保持独立生态,并完成从“开源实验室”到“商业基础设施”的身份跃迁。
两者所处的节点截然不同,但共同面对的问题却高度一致。当融资规模超越技术叙事本身,千亿估值的最终支撑力,必须回到营收增速和商业化效率的实证中去寻找。
本文来自微信公众号“新博弈”,作者:祝卿安,36氪经授权发布。
该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。
