DeepSeek-V4 explicitly supports the Huawei Ascend 950 chip.
36Kr
吴俊宇
DeepSeek-V4明确支持华为昇腾950芯片半熟财经·2026年04月24日 16:27DeepSeek-V4发布,下半年昇腾950上市后价格将下调。华为未披露广东省1987-09信息与通信基础设施和智能终端提供商36氪报道前沿技术智能硬件高新技术企业企业技术中心技术创新示范企业我要联系 受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市
DeepSeek-V4明确支持华为昇腾950芯片半熟财经·2026年04月24日 16:27DeepSeek-V4发布,下半年昇腾950上市后价格将下调。华为未披露广东省1987-09信息与通信基础设施和智能终端提供商36氪报道前沿技术智能硬件高新技术企业企业技术中心技术创新示范企业我要联系
受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调
时隔145 天,DeepSeek终于发布了新模型。
4月24日,DeepSeek宣布上线DeepSeek-V4的预览版本——其中包括两款模型,高性能版的DeepSeek-V4-Pro、轻量版的DeepSeek-V4-Flash。
按照DeepSeek官方披露的信息,DeepSeek-V4拥有百万字超长上下文,在Agent(智能体)能力、世界知识和推理性能上均在国内和开源领域保持领先。
DeepSeek还披露,目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding(智能体编程)模型,评测反馈使用体验优于Claude Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Claude Opus 4.6的思考模式存在一定差距。
和全球最强模型的差距只有两个月
目前Anthropic旗下最先进的基础模型是4月16日发布的Claude Opus 4.7,它的综合性能几乎位居全球第一。Claude Opus 4.6于2月25日发布。
也就是说,DeepSeek-V4和全球性能最先进的模型性能差距几乎只有两个月左右。
DeepSeek发布模型的频率在主流模型厂商中几乎是最低的,时隔近五个月,它才发布了这款新模型。
据《财经》不完全统计,2025年12月1日-2026年4月24日,美国市场(OpenAI、Anthropic、谷歌Gemini)和中国(包括阿里千问、字节跳动豆包、腾讯混元、小米MiMo、DeepSeek、月之暗面、智谱、MiniMax)的11家主流模型公司,在144天内至少发布或迭代了53款模型,几乎每2.7天就会有一款模型发布或迭代。
DeepSeek-V4的技术报告披露,它使用了32万亿以上的Tokens(词元)进行训练。它的训练过程经历了三个阶段——预训练(Pre-training)、后训练(Post-training)、推理能力强化(Reasoning scaling)。
其中DeepSeek-V4-Pro的参数规模是1.6万亿,激活参数是490亿。DeepSeek-V4-Flash的参数规模是2840亿,激活参数是130亿。由于架构创新且不是全量激活,DeepSeek-V4每次激活时的推理计算成本只相当于百亿级参数规模的模型。
DeepSeek还公布了DeepSeek-V4两个版本模型的价格。其中高性能版的DeepSeek-V4-Pro输入价格1元/百万Tokens,输出价格24元/百万Tokens。轻量版的DeepSeek-V4-Flash输入价格0.2元/百万Tokens,输出价格2元/百万Tokens。
明确支持华为昇腾950,Token价格将大幅下降
市场关注的另一个问题是,DeepSeek-V4是否会提前适配华为昇腾950等国产AI(人工智能)芯片,甚至是否会基于国产AI芯片完成训练。
目前可以确认的是,DeepSeek-V4一定会支持华为昇腾950,并使用昇腾950进行推理。但它不一定是基于华为昇腾950训练的。
因为,DeepSeek在披露价格的同时,还在价格栏的小字中明确提到——受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。
(图片来源:DeepSeek微信公众号)
也就是说,DeepSeek-V4系列的模型明确支持华为昇腾950这款国AI产芯片,且预计将在国产AI芯片上大幅降低单位Token价格。
昇腾950华为规划于2026年推出,面向大模型训练和推理的新一代AI芯片,它是昇腾910系列的升级版。一位华为计算产品合作伙伴今年3月曾向《财经》评价,在当前国产AI推理卡中,华为昇腾950极具竞争力。因为该卡采用全新架构,是目前国内唯一已商用、并明确支持FP4低精度推理的AI加速卡。
支持FP4意味着能把模型“压缩得更狠”,同样一张卡,能跑得动更大、更复杂的AI模型,而且速度更快、成本更低。《财经》了解到,华为昇腾950的单卡算力是英伟达H20的2.87倍,且搭载了华为自研国产HBM(高带宽内存)芯片。
一位算法工程师对《财经》表示,DeepSeek-V4适配国产AI芯片在预期之内。因为模型推理对国产AI芯片来说并不是难点。几乎所有中国模型公司发布新模型后,都会Day0适配包括华为昇腾、阿里平头哥、百度昆仑芯、寒武纪等国产AI芯片。
本文来自微信公众号“半熟财经”(ID:Banshu-Caijing),作者:吴俊宇 周源,编辑:谢丽容,36氪经授权发布。
该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。
