Zhiyuan: FlagOS completes Day 0 adaptation for DeepSeekV4 across eight chips, achieving three major technological breakthroughs.

Leiphone

雷锋网

Apr 24, 2026, 07:01 AM

雷峰网讯 DeepSeek今日发布了DeepSeek-V4-Pro 1.6T 旗舰模型(1.86万亿参数）及DeepSeek-V4-Flash 284B 高效模型（2840亿）。由智源研究院牵头研发的众智FlagOS第一时间对两个“巨无霸”模型进行全量适配，已经完成 DeepSeek-V4-Flash在 8款以上 AI 芯片上的全量适配与推理部署，包括海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数、英伟达（FP8）等芯片。FlagOS 同时正在推进 DeepSeek-V4-Pro 模型在多个芯片的迁移适配，后续即将开源。首先完成在八款芯片适配的DeepSeek-V4-Flash 是深度求索推出的 V4 系列两大模型之一，采用混合专家（MoE）架构，总参数量 284B，激活参数仅 13B，支持 100 万 token上下文长度。该模型在架构上引入了混合注意力机制（结合压缩稀疏注意力CSA与高度压缩注意力HCA，大幅提升长上下文效率）、流形约束超连接（mHC，增强跨层信号传播稳定性）以及 Muon优化器（加速收敛、提升训练稳定性）。预训练数据超过32Ttoken，后