AI News Hub Logo

AI News Hub

New Cycle in the Era of AI Reasoning

36Kr
格隆汇

AI推理时代新周期格隆汇·2026年05月12日 16:50产能瓶颈带动多领域缺货 2026年5月,全球科技产业正式进入AI推理主导的全新周期。 市场风格发生鲜明切换:曾经被视为“配角”的CPU迎来需求爆发,英特尔年内股价暴涨近两倍,带动海光信息等国产CPU厂商同步走强;与此同时,存储芯片延续供给紧缺态势,板块景气度贯穿全年。 这并非短期题材炒作,而是AI产业从“训练为王”转向“推理落地”带来的

AI推理时代新周期格隆汇·2026年05月12日 16:50产能瓶颈带动多领域缺货 2026年5月,全球科技产业正式进入AI推理主导的全新周期。 市场风格发生鲜明切换:曾经被视为“配角”的CPU迎来需求爆发,英特尔年内股价暴涨近两倍,带动海光信息等国产CPU厂商同步走强;与此同时,存储芯片延续供给紧缺态势,板块景气度贯穿全年。 这并非短期题材炒作,而是AI产业从“训练为王”转向“推理落地”带来的结构性巨变。 当大模型从云端实验室走向千行百业,当每一台终端、每一个设备都开始搭载AI代理(AgentAI),计算架构被彻底重构,CPU与存储同步进入供需紧缺时代,这一格局有望贯穿今年整年,成为半导体投资最确定的主线。 CPU“配角”逆袭之路 过去两年,全球资本几乎全部聚焦于AI训练赛道,GPU成为绝对核心,英伟达凭借垄断地位登顶全球市值巅峰。 在传统数据中心训练架构中,8颗GPU搭配1颗CPU是行业常态,CPU仅承担辅助调度、系统控制等基础工作,处于“被带动”的边缘位置。 但2026年以来,AI产业出现决定性转折:大规模推理落地全面取代训练,成为行业核心矛盾。 随着企业级AI服务、智能终端、自动驾驶、工业互联、AI代理等场景规模化普及,单纯依靠GPU的并行计算已无法满足复杂系统调度、串行任务处理、多场景协同的需求。 CPU凭借冯・诺依曼架构天然优势,重新回到舞台中央。它擅长逻辑控制、串行运算、系统级调度,能够连接底层硬件与上层应用,形成完整机器语言,这是GPU无法替代的核心能力。 计算架构配比的剧变,最能说明问题: 训练阶段:GPU:CPU=8:1/4:1 云端推理阶段:GPU:CPU=4:1/2:1 AI代理+端侧智能阶段:GPU:CPU有望逼近1:1 这意味着,在AI推理时代,CPU的需求量将迎来指数级增长。过去只用于服务器、PC的CPU,未来将渗透至手机、汽车、工业控制、边缘节点、智能家居、机器人等几乎所有智能终端,成为AI无处不在的“算力底座”。 这正是本轮CPU行情爆发的底层逻辑:推理落地=CPU刚需爆发。需求突然爆发,而产能扩张滞后,带来供需缺口持续扩大,相关企业迎来业绩与估值双击。 产能瓶颈带动多领域缺货 AI推理带来的需求爆发,迅速击穿了整个半导体产业链的供需平衡,形成CPU缺货、存储缺货、先进工艺缺货的三重紧缺格局。 早在2025年底,行业就已达成共识:存储缺货将持续至2028年新产能释放,价格拐点最早出现在2027年下半年。但AgentAI(AI代理)的加速普及,彻底打乱行业节奏,进一步放大缺口: 终端设备内存从16GB跃升至100GB以上 存储空间从512GB/1TB提升至几十TB 边缘节点对低时延、高可靠存储需求成倍增加 与此同时,全球科技巨头开启AI军备竞赛。美国前四大云厂商(CSP)2026年资本开支预计突破7000亿美元,规模远超历史总和。这种前置性、高强度投入,本质是将AI作为国家与科技企业的“基础设施”来竞争,谁落后,谁就被淘汰。 中短期看,两大核心瓶颈难以缓解: 存储供给刚性极强:海外原厂扩产周期长达18—24个月,扩产速度远跟不上需求爆发,价格持续上涨具备坚实支撑。 先进制程产能极度紧张:台积电、英特尔等先进工艺产能被长协锁定,新订单难以插入,CPU、GPU、存储芯片同时抢产能。 可以判断,CPU与存储的双紧缺格局,将成为2026—2028年行业常态,供需失衡不会因短期波动而改变。 国内外CPU厂家回归C位 在全球CPU厂商中,英特尔成为本轮推理周期的最大赢家。其股价年内大涨近两倍,核心并非单纯受益于需求爆发,而是独有的IDM模式+自有先进工艺+全场景生态形成了无法撼动的壁垒。 与AMD、英伟达等依赖第三方代工厂不同,英特尔拥有自有晶圆厂,能够独立掌控产能节奏。当行业订单突然翻倍,其他厂商必须排队等待台积电产能,而英特尔可直接通过提升良率、释放自有产能快速响应,扩产弹性显著领先。 工艺层面,英特尔14A已大规模稳定出货,18A工艺良率快速爬升,先进制程供应能力持续增强,进一步夯实市场信心。 更重要的是,英特尔拥有x86生态+完整IP库+数十年软硬件协同积累,形成“芯片+指令集+系统+软件+应用”的完整闭环。这种生态壁垒,不是单纯依靠芯片性能可以替代的,也是AMD、ARM阵营短期内难以超越的核心优势。 市场普遍认为,英特尔在移动互联网时代错失机遇,但在AI时代,计算中心重回CPU主导,英特尔凭借最深厚的技术与生态积累,重新站上行业制高点。 回归国内市场,以海光信息、龙芯、华为鲲鹏、飞腾为代表的国产CPU,同样迎来历史性机遇。 在信创与自主可控战略推动下,国产CPU在政府、金融、能源、通信等关键领域渗透率快速提升,下游客户普遍预留2到3个国产供应席位,生态适配从“被动兼容”转向“主动拥抱”。 当前国产CPU的核心突破点在于: 大模型与芯片深度适配:以DeepSeekV4为代表的国产大模型,在开发阶段就与本土芯片进行协同优化,实现“模型定义芯片,芯片支撑模型”。 轻量化推理降低门槛:国产大模型走向轻量化、低成本化,可大幅降低终端部署难度,直接拉动国产CPU需求。 场景优势突出:中国在终端应用、行业智能化、边缘计算领域具备全球领先的落地速度,国产CPU更贴合本土场景。 但行业也面临明确挑战:先进制程供应受限、生态成熟度仍有差距、高性能产品供给不足。长期看,随着国产制程进步、生态完善,国产CPU有望在AI推理时代实现跨越式发展。 存储的超级周期延续 存储芯片方面,本轮行情的核心特征是产业利润向上游集中。 三星、海力士、美光等国际原厂凭借产能壁垒、长协锁定、技术迭代优势,将未来2到3年的订单与利润“尽收囊中”。HBM3E刚实现稳定供给,HBM4已进入紧缺状态,技术迭代持续打开价值空间。 与之相对,存储模组厂的话语权持续削弱。大客户纷纷越过模组厂,直接与原厂签订3到5年长约,原厂也倾向于直供保障利润,模组环节被不断边缘化。 对投资者而言,存储赛道的核心逻辑依然是:供给刚性、需求爆发、价格上行、龙头集中。行业仍处于超级周期中段,远未到结束时点。 硬件价值全面回归 2026年,全球科技投资正在发生深刻范式转移:从软件叙事转向硬件价值回归。 AI想要真正落地,必须依靠坚实的算力底座。CPU、存储、先进制程、服务器、高速互联等硬件环节,拥有数十年技术积累、极高认证壁垒、强现金流与抗周期能力,是软件生态无法替代的核心资产。 从GPU一家独大,到CPU+存储双轮驱动;从云端训练,到全域推理;从依赖外部生态,到自主可控推进,中国半导体正站在AI硬件革命的最前沿。 未来2到3年,行业主旋律依然是供需失衡:CPU需求爆发、存储周期延续、先进工艺持续紧缺。对投资者而言,抓住具备核心技术、产能壁垒、生态优势的硬件龙头,远比追逐短期热点更具确定性。 CPU领域:英特尔,海光信息 存储领域:海力士,三星,大普微,兆易创新。 免责声明:本文版权属于北京格隆汇投资顾问有限公司投研团队(曾润:A0160623020001)整理,本报告基于独立、客观、公正和审慎的原则制作,信息均来源于公开资料并予以合法合理适当的采集摘要与编辑。 股市有风险,入市需谨慎。本文中的任何投资建议均不作为您投资买卖的依据,您须独立作出投资决策,风险自担。任何单位或个人未经本公司许可,擅自发布、复制、传播或网络发表、转载等均视为侵权,本公司将依法追究侵权责任。 本文来自微信公众号 “格隆汇财经热点”(ID:glh_finance),作者:格隆汇小编,36氪经授权发布。 该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。