Going global with tokens can't rely on the old story of "Made in China."

Token出海，讲不了中国制造的老故事世界模型工场·2026年04月30日 20:47没那么简单中国大模型在海外市场的存在感，正在变得越来越强。这让一个新叙事迅速升温：中国模型能不能像光伏、电池、新能源车一样，把Token也做成一种新的产业出海？过去十年，中国企业凭借规模效应和成本优势，在全球光伏和电动车市场实现了从追赶者到主导者的跃迁。如今，AI大模型似乎站在了相似的起跑线上。论模型能力，中国头部模型在某些指标上已接近GPT-5；论成本，国内低廉的电价和规模化的算力基础设施，仿佛为Token的大规模生产准备好了世界工厂。按照这个逻辑，接下来的剧本应该是：将国内便宜的电力、便宜的国产算力，转化为海量低价的API调用服务，像卖光伏板一样，把Token卖向全球。这个逻辑听起来很自洽，甚至令人心潮澎湃。但一位AI产业一线从业者直言不讳地指出：“想法挺好，但只是一个愿景”。换句话说，中国Token出海的故事，远没有把便宜算力卖到海外那么简单。 Token出海的伪命题 Token出海这个概念之所以让人兴奋，是因为它听起来太像中国制造过去反复验证的成功公式。但Token和光伏，是两种截然不同的商品。光伏组件，卖的是实物。成本和质量，主要在工厂大门之内决定。 Token卖的是持续在线的数据处理服务。 Token的成本和质量，在每一次调用、每一次数据处理、每一次内容生成、每一次企业审计中被重新验证。它天然牵涉数据跨境、网络时延、隐私保护、内容审核、服务审计、客户信任等问题。这种特殊性，使得Token出海比实物出海要复杂得多。很多人讲Token出海，第一反应是中国电力和算力便宜。这话没错，Token经济的核心成本是电力和算力。中国的数据中心电价确实便宜，全国平均约每度0.38元，远低于欧盟、新加坡的平均电价1-1.5元/度。从算力租赁价格来看，国内同等规格GPU租赁价格也低于海外，尤其在长约、私有化部署和非顶级GPU资源上更明显。但问题是，电力无法跨国传输，数据中心也无法装箱上船。 Token是实时生成的，延迟会直接影响体验。如果要服务海外用户，服务器必须部署在离他们足够近的地方。跨太平洋光纤仅物理往返时延就在几十毫秒级，叠加网络路由后极易超过100毫秒。对于AI实时交互型应用而言，这种延迟不可接受。在物理规律上，就很难复制“国内低成本生产、全球销售”的制造业路径。但比物理更硬的墙，是合规。即便海外用户勉强容忍延迟，合规问题也没有任何商量余地。在国内进行Token推理，意味着海外用户的prompt需要跨境传输，其中可能包含个人信息、商业机密。欧美对个人信息、企业数据和跨境传输有严格监管，东南亚、中东等市场也在加强数据主权和本地化要求。对任何有规模的海外企业客户而言，把用户数据传回中国处理是合规红线。也就是说，Token想要合规出海到企业，推理节点必须部署在当地，用当地昂贵的算力。国内的低价电力和算力，被这道墙彻底拦截。到这里，一个结论已经清晰：广为流传的“便宜电+便宜卡”出海逻辑，是个伪命题。但这套逻辑证伪，并不等于Token出海没机会。既然电力不能出海，算力不能出海，那可以出海的究竟是什么？真实的Token出海模式真实世界里的Token出海，远比逻辑论证更复杂，目前出现了四种形态：模式一：开发者平台出海当前最清晰、也最容易被看见的Token出海，首先发生在海外开发者市场。对于很多海外个人开发者或初创小团队，他们对合规的敏感度不高，一定程度的时延也可以接受，但对成本极度敏感。这时中国模型就可以基于国内节点提供API服务，给出一个极低的价格。在当下的Agent趋势下，一次任务就可能消耗数十万甚至上百万Token，模型成本的敏感度被急剧放大。中国模型凭借仅相当于美国模型1/6乃至1/10的价格，吃到了这波红利。一个开发者真实的使用方式是，在OpenRouter这类AI模型聚合平台上，通过同一个API入口访问全球多家大模型，其中：复杂架构设计、长程调试、关键代码修改，交给Claude、GPT等美国高端模型；批量摘要、文档处理、免费用户流量、小bug修复，则交给GLM、MiniMax、Kimi、DeepSeek等中国模型。这种模式被开发者社区称为"模型路由"或"模型级联"，即用美国高端模型做规划和兜底，用中国模型做执行和批量处理。这套打法是，中国模型不直接卖给终端用户，而是成为全球模型路由池里的低成本选项，嵌入全球开发者的工具链。 OpenRouter榜单数据显示，截至2026年2月，中国AI模型的调用量在三周内大涨127%，首次超越美国模型。这意味着中国模型被海外开发者真实使用，这也是中国Token出海目前最活跃的模式。模式二：海外云市场出海如果说开发者平台解决的是有人愿意试的问题，那么海外云市场解决的是另一个更根本的问题：企业敢不敢用？对海外企业客户来说，直接调用一个部署在中国节点的模型API，阻力极大。它们会反复追问：数据是否传入中国？日志保存在哪里？prompt和输出是否会被用于模型训练？服务是否符合当地监管要求？出了问题谁来负责？这正是智谱、Minimax等中国模型，进入AWS这类海外云平台的意义所在。这里的核心逻辑是，中国模型能力出海+海外节点本地化推理。第一步，能力输出。中国厂商把自己的大模型部署到海外的公有云上。第二步，本地生产和消费。这些部署在海外的模型，直接在当地云区域的物理服务器上运行，Token的生成和消费过程完全发生在当地，数据全程不离开所在地区。这就像可口可乐，核心配方是美国的，但生产罐装都在全球各地的本地工厂，用的都是当地的水。而中国厂商出口的是最值钱的模型智力，即那个被训练好、被验证过、被持续迭代的模型权重文件。剩下的物理生产环节，则通过租用海外算力，实现彻底本地化。但这并不意味着合规问题彻底消失。模型供应商权限、日志留存、数据是否用于训练、服务责任划分等问题，仍然需要合同和技术机制进一步约束。目前这种模式才刚刚起步，是走向海外企业级采购的关键一跃。模式三：“数据保税区”的实验如果说前两种模式是用技术和商业手段绕开障碍，那么第三种路径，则是更具中国特色的尝试：特殊区域，近岸出海。近日，汕头华侨试验区完成了中国首例Token出海全链路闭环验证，其核心架构被称为“前店后厂”：在国内完成模型训练后，将其部署在试验区的“来数加工”专区。这个区域与国内互联网完全物理隔离，海外用户的请求，通过汕头国际海缆直连进入区内完成推理，生成的Token再原路返回，测试延迟低至32.7毫秒。这有点像“数字保税区”，它试图解决的是一个很具体的矛盾：如果模型部署在海外云上，成本优势下降；如果直接用国内机房服务海外客户，又会面临数据跨境和合规质疑。于是，汕头模式把中间地带制度化，用“来数加工”方式，划清数据和服务的边界。这条路的想象力很强。它试图把中国境内的电力、算力、机房、运维和模型服务能力，包装成一种跨境数字服务加工能力。如果能跑通，某种意义上就把国内低成本算力接进了海外市场。模式四：开源模型出海 DeepSeek正是这种路径的代表。核心做法是，将模型全面开源，将模型权重完全交给全球的开发者、研究机构和商业公司。在这种架构下，推理部署由用户自行完成，合规责任也自然转移到部署方和用户端。这未必是严格意义上的Token收入出海，但却是一种Token能力的出海。从产业影响力看，一旦海外开发者、企业、云服务商把中国开源模型，部署到自己的环境里，中国模型就进入了全球技术栈。这是一种更难追溯、也更难被制裁的方式，让中国Token持续渗透进全球AI供应链的毛细血管。离全球化还有多远？中国Token出海已经动起来了，但在能跑通和能成事之间，还横着几道坎。第一道坎：商业化的窄门。开发者平台出海，是当下声势最大的模式。但开发者市场有一个天然问题，开发者对价格极度敏感，也最容易切换模型。极低的迁移成本，意味着模型厂商很难在开发者群体中，建立稳定的收入护城河。更重要的是，开发者群体的付费天花板相当有限。模型厂商要在这个市场里持续赚钱，要么规模极大、薄利多销，要么向上突破企业级客户。但后者正是中国模型目前最难攻下的堡垒，合规门槛、品牌信任、SLA保障，每一关都比开发者市场硬得多。海外云市场出海，同样面临成本拷问。把模型部署在AWS、Azure等海外云上，意味着必须支付当地昂贵的GPU租金和电价，国内低价电力和算力的优势，在这一环彻底消失。厂商能依仗的，只剩下模型本身的工程效率。一个推理更省算力的模型，确实能在海外用更少的硬件实现更低的生产成本。但当美国厂商也开始铺量降价时，这条靠技术优势留下的利润空间，还能守住多宽？这对中国模型厂商的工程迭代速度，是一种持续且高压的考验。至于开源模型出海，其商业闭环更间接。它对全球AI生态的贡献毋庸置疑，但短期内要靠它赚钱，是另一回事。第二道坎：区域出海的天花板。汕头模式提供了一种精巧的制度解法，但这套架构的服务半径，更适合东南亚及周边。一旦目标市场扩展到欧洲或北美，就不再具备同样优势。从安全合规角度看，汕头模式也依然更适合低敏感和中低风险任务。如果是金融、医疗、法律、政企核心数据，客户未必愿意接受“数据进入中国境内特殊专区”这个解释。更根本的问题在于，即便在东南亚这个服务半径内，利润空间也并非理所当然。新加坡客户可能付费能力强，但新加坡本地云和数据中心也更成熟。越南、印尼、泰国、菲律宾等市场增长快、价格敏感，但客单价和ASP不一定高。汕头模式要赚钱，更依赖规模、低成本和渠道合作，而不是高毛利企业Token。所以，汕头模式不是全球通用答案。它更像是中国Token出海的一个区域样板：面向东南亚的近岸AI工厂。门槛三：Token的质量。中国模型在市场上确实有性价比优势，但性价比成立有一个前提：质量必须先跨过可用门槛。如果Token质量不稳定，价格再低也没人买。但所谓Token质量，并不是一个静态指标。它会随着模型竞争、算法迭代、算力投入、产品反馈等不断变化。全球模型仍在快速进化，如果中国模型持续落后，那么今天看起来还能接受的质量差距，未来可能重新被拉大。而更隐蔽、也更具杀伤力的问题，在于“高分贝沉默”。即模型在某些触碰内容安全边界的问题上，突然拒答、回避，甚至给出与用户语境完全不匹配的安全提示。对一家全球化企业来说，一个AI服务如果在不同国家、不同文化、不同业务语境下，随时可能“失声”，就无法被企业接受。同时，语感和文化适配也是一场硬仗。一个用中文逻辑训练出的英文模型，语法可以完全正确，但母语者读完总觉得怪。它不是基准测试能衡量的，却能在真实场景中决定产品的存亡。这也是中国Token出海最难的一点，让全球用户愿意把更多任务交给中国模型。结语中国Token出海现在所处的阶段，更像是光伏产业链在2008年之前的那个时刻：技术能力已被部分验证，海外需求真实存在，但产业地位、定价权、高端市场份额，都还没有拿到。那个时刻的光伏，距离后来对全球市场的统治力，还隔着十多年的博弈。现阶段的Token出海，还只是一个故事的开头，它值得被认真讲述，但远不到被庆祝的时候。本文来自微信公众号“世界模型工场”，作者：世界模型工场，36氪经授权发布。该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。