AI News Hub Logo

AI News Hub

Going global with tokens can't rely on the old story of "Made in China."

36Kr
世界模型工场

Token出海,讲不了中国制造的老故事世界模型工场·2026年04月30日 20:47没那么简单 中国大模型在海外市场的存在感,正在变得越来越强。  这让一个新叙事迅速升温: 中国模型能不能像光伏、电池、新能源车一样,把Token也做成一种新的产业出海? 过去十年,中国企业凭借规模效应和成本优势,在全球光伏和电动车市场实现了从追赶者到主导者的跃迁。 如今,AI大模型似乎站在了相似的起跑线上。 论

Token出海,讲不了中国制造的老故事世界模型工场·2026年04月30日 20:47没那么简单 中国大模型在海外市场的存在感,正在变得越来越强。  这让一个新叙事迅速升温: 中国模型能不能像光伏、电池、新能源车一样,把Token也做成一种新的产业出海? 过去十年,中国企业凭借规模效应和成本优势,在全球光伏和电动车市场实现了从追赶者到主导者的跃迁。 如今,AI大模型似乎站在了相似的起跑线上。 论模型能力,中国头部模型在某些指标上已接近GPT-5; 论成本,国内低廉的电价和规模化的算力基础设施,仿佛为Token的大规模生产准备好了世界工厂。 按照这个逻辑,接下来的剧本应该是: 将国内便宜的电力、便宜的国产算力,转化为海量低价的API调用服务,像卖光伏板一样,把Token卖向全球。 这个逻辑听起来很自洽,甚至令人心潮澎湃。 但一位AI产业一线从业者直言不讳地指出:“想法挺好,但只是一个愿景”。 换句话说,中国Token出海的故事,远没有把便宜算力卖到海外那么简单。 Token出海的伪命题 Token出海这个概念之所以让人兴奋,是因为它听起来太像中国制造过去反复验证的成功公式。 但Token和光伏,是两种截然不同的商品。 光伏组件,卖的是实物。成本和质量,主要在工厂大门之内决定。 Token卖的是持续在线的数据处理服务。 Token的成本和质量,在每一次调用、每一次数据处理、每一次内容生成、每一次企业审计中被重新验证。 它天然牵涉数据跨境、网络时延、隐私保护、内容审核、服务审计、客户信任等问题。 这种特殊性,使得Token出海比实物出海要复杂得多。 很多人讲Token出海,第一反应是中国电力和算力便宜。 这话没错,Token经济的核心成本是电力和算力。 中国的数据中心电价确实便宜,全国平均约每度0.38元,远低于欧盟、新加坡的平均电价1-1.5元/度。 从算力租赁价格来看,国内同等规格GPU租赁价格也低于海外,尤其在长约、私有化部署和非顶级GPU资源上更明显。 但问题是,电力无法跨国传输,数据中心也无法装箱上船。 Token是实时生成的,延迟会直接影响体验。 如果要服务海外用户,服务器必须部署在离他们足够近的地方。 跨太平洋光纤仅物理往返时延就在几十毫秒级,叠加网络路由后极易超过100毫秒。 对于AI实时交互型应用而言,这种延迟不可接受。 在物理规律上,就很难复制“国内低成本生产、全球销售”的制造业路径。 但比物理更硬的墙,是合规。 即便海外用户勉强容忍延迟,合规问题也没有任何商量余地。 在国内进行Token推理,意味着海外用户的prompt需要跨境传输,其中可能包含个人信息、商业机密。 欧美对个人信息、企业数据和跨境传输有严格监管,东南亚、中东等市场也在加强数据主权和本地化要求。 对任何有规模的海外企业客户而言,把用户数据传回中国处理是合规红线。 也就是说,Token想要合规出海到企业,推理节点必须部署在当地,用当地昂贵的算力。 国内的低价电力和算力,被这道墙彻底拦截。 到这里,一个结论已经清晰: 广为流传的“便宜电+便宜卡”出海逻辑,是个伪命题。 但这套逻辑证伪,并不等于Token出海没机会。 既然电力不能出海,算力不能出海,那可以出海的究竟是什么? 真实的Token出海模式 真实世界里的Token出海,远比逻辑论证更复杂,目前出现了四种形态: 模式一:开发者平台出海 当前最清晰、也最容易被看见的Token出海,首先发生在海外开发者市场。 对于很多海外个人开发者或初创小团队,他们对合规的敏感度不高,一定程度的时延也可以接受,但对成本极度敏感。 这时中国模型就可以基于国内节点提供API服务,给出一个极低的价格。 在当下的Agent趋势下,一次任务就可能消耗数十万甚至上百万Token,模型成本的敏感度被急剧放大。 中国模型凭借仅相当于美国模型1/6乃至1/10的价格,吃到了这波红利。 一个开发者真实的使用方式是,在OpenRouter这类AI模型聚合平台上,通过同一个API入口访问全球多家大模型,其中: 复杂架构设计、长程调试、关键代码修改,交给Claude、GPT等美国高端模型; 批量摘要、文档处理、免费用户流量、小bug修复,则交给GLM、MiniMax、Kimi、DeepSeek等中国模型。 这种模式被开发者社区称为"模型路由"或"模型级联",即用美国高端模型做规划和兜底,用中国模型做执行和批量处理。 这套打法是,中国模型不直接卖给终端用户,而是成为全球模型路由池里的低成本选项,嵌入全球开发者的工具链。 OpenRouter榜单数据显示,截至2026年2月,中国AI模型的调用量在三周内大涨127%,首次超越美国模型。 这意味着中国模型被海外开发者真实使用,这也是中国Token出海目前最活跃的模式。 模式二:海外云市场出海 如果说开发者平台解决的是有人愿意试的问题,那么海外云市场解决的是另一个更根本的问题:企业敢不敢用? 对海外企业客户来说,直接调用一个部署在中国节点的模型API,阻力极大。 它们会反复追问: 数据是否传入中国?日志保存在哪里?prompt和输出是否会被用于模型训练?服务是否符合当地监管要求?出了问题谁来负责? 这正是智谱、Minimax等中国模型,进入AWS这类海外云平台的意义所在。 这里的核心逻辑是,中国模型能力出海+海外节点本地化推理。 第一步,能力输出。 中国厂商把自己的大模型部署到海外的公有云上。 第二步,本地生产和消费。 这些部署在海外的模型,直接在当地云区域的物理服务器上运行,Token的生成和消费过程完全发生在当地,数据全程不离开所在地区。 这就像可口可乐,核心配方是美国的,但生产罐装都在全球各地的本地工厂,用的都是当地的水。 而中国厂商出口的是最值钱的模型智力,即那个被训练好、被验证过、被持续迭代的模型权重文件。 剩下的物理生产环节,则通过租用海外算力,实现彻底本地化。 但这并不意味着合规问题彻底消失。 模型供应商权限、日志留存、数据是否用于训练、服务责任划分等问题,仍然需要合同和技术机制进一步约束。 目前这种模式才刚刚起步,是走向海外企业级采购的关键一跃。 模式三:“数据保税区”的实验 如果说前两种模式是用技术和商业手段绕开障碍,那么第三种路径,则是更具中国特色的尝试: 特殊区域,近岸出海。 近日,汕头华侨试验区完成了中国首例Token出海全链路闭环验证,其核心架构被称为“前店后厂”: 在国内完成模型训练后,将其部署在试验区的“来数加工”专区。 这个区域与国内互联网完全物理隔离,海外用户的请求,通过汕头国际海缆直连进入区内完成推理,生成的Token再原路返回,测试延迟低至32.7毫秒。 这有点像“数字保税区”,它试图解决的是一个很具体的矛盾: 如果模型部署在海外云上,成本优势下降;如果直接用国内机房服务海外客户,又会面临数据跨境和合规质疑。 于是,汕头模式把中间地带制度化,用“来数加工”方式,划清数据和服务的边界。 这条路的想象力很强。 它试图把中国境内的电力、算力、机房、运维和模型服务能力,包装成一种跨境数字服务加工能力。 如果能跑通,某种意义上就把国内低成本算力接进了海外市场。 模式四:开源模型出海 DeepSeek正是这种路径的代表。 核心做法是,将模型全面开源,将模型权重完全交给全球的开发者、研究机构和商业公司。 在这种架构下,推理部署由用户自行完成,合规责任也自然转移到部署方和用户端。 这未必是严格意义上的Token收入出海,但却是一种Token能力的出海。 从产业影响力看,一旦海外开发者、企业、云服务商把中国开源模型,部署到自己的环境里,中国模型就进入了全球技术栈。 这是一种更难追溯、也更难被制裁的方式,让中国Token持续渗透进全球AI供应链的毛细血管。 离全球化还有多远? 中国Token出海已经动起来了,但在能跑通和能成事之间,还横着几道坎。 第一道坎:商业化的窄门。 开发者平台出海,是当下声势最大的模式。 但开发者市场有一个天然问题,开发者对价格极度敏感,也最容易切换模型。 极低的迁移成本,意味着模型厂商很难在开发者群体中,建立稳定的收入护城河。 更重要的是,开发者群体的付费天花板相当有限。 模型厂商要在这个市场里持续赚钱,要么规模极大、薄利多销,要么向上突破企业级客户。 但后者正是中国模型目前最难攻下的堡垒,合规门槛、品牌信任、SLA保障,每一关都比开发者市场硬得多。 海外云市场出海,同样面临成本拷问。 把模型部署在AWS、Azure等海外云上,意味着必须支付当地昂贵的GPU租金和电价,国内低价电力和算力的优势,在这一环彻底消失。 厂商能依仗的,只剩下模型本身的工程效率。 一个推理更省算力的模型,确实能在海外用更少的硬件实现更低的生产成本。 但当美国厂商也开始铺量降价时,这条靠技术优势留下的利润空间,还能守住多宽? 这对中国模型厂商的工程迭代速度,是一种持续且高压的考验。 至于开源模型出海,其商业闭环更间接。 它对全球AI生态的贡献毋庸置疑,但短期内要靠它赚钱,是另一回事。 第二道坎:区域出海的天花板。 汕头模式提供了一种精巧的制度解法,但这套架构的服务半径,更适合东南亚及周边。 一旦目标市场扩展到欧洲或北美,就不再具备同样优势。 从安全合规角度看,汕头模式也依然更适合低敏感和中低风险任务。 如果是金融、医疗、法律、政企核心数据,客户未必愿意接受“数据进入中国境内特殊专区”这个解释。 更根本的问题在于,即便在东南亚这个服务半径内,利润空间也并非理所当然。 新加坡客户可能付费能力强,但新加坡本地云和数据中心也更成熟。 越南、印尼、泰国、菲律宾等市场增长快、价格敏感,但客单价和ASP不一定高。 汕头模式要赚钱,更依赖规模、低成本和渠道合作,而不是高毛利企业Token。 所以,汕头模式不是全球通用答案。 它更像是中国Token出海的一个区域样板:面向东南亚的近岸AI工厂。 门槛三:Token的质量。 中国模型在市场上确实有性价比优势,但性价比成立有一个前提:质量必须先跨过可用门槛。 如果Token质量不稳定,价格再低也没人买。 但所谓Token质量,并不是一个静态指标。 它会随着模型竞争、算法迭代、算力投入、产品反馈等不断变化。 全球模型仍在快速进化,如果中国模型持续落后,那么今天看起来还能接受的质量差距,未来可能重新被拉大。 而更隐蔽、也更具杀伤力的问题,在于“高分贝沉默”。 即模型在某些触碰内容安全边界的问题上,突然拒答、回避,甚至给出与用户语境完全不匹配的安全提示。 对一家全球化企业来说,一个AI服务如果在不同国家、不同文化、不同业务语境下,随时可能“失声”,就无法被企业接受。 同时,语感和文化适配也是一场硬仗。 一个用中文逻辑训练出的英文模型,语法可以完全正确,但母语者读完总觉得怪。  它不是基准测试能衡量的,却能在真实场景中决定产品的存亡。 这也是中国Token出海最难的一点,让全球用户愿意把更多任务交给中国模型。 结语 中国Token出海现在所处的阶段,更像是光伏产业链在2008年之前的那个时刻: 技术能力已被部分验证,海外需求真实存在,但产业地位、定价权、高端市场份额,都还没有拿到。 那个时刻的光伏,距离后来对全球市场的统治力,还隔着十多年的博弈。 现阶段的Token出海,还只是一个故事的开头,它值得被认真讲述,但远不到被庆祝的时候。 本文来自微信公众号“世界模型工场”,作者:世界模型工场,36氪经授权发布。 该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。