Ant Group's Bailing Large Model Ling-2.6-flash Released, Averaging 100 Billion Token Calls Daily After Anonymous Launch for One Week
ITHome
IT之家
IT之家 4 月 22 日消息,蚂蚁集团旗下的百灵大模型今日宣布,推出一款总参数量 104B、激活参数 7.4B 的 Instruct 模型 Ling-2.6-flash 。 一周前,代号为 Elephant Alpha 的匿名模型登陆 OpenRouter。上线以来,其调用量持续增长,连续多日位列 Trending 榜首,日均 tokens 调用量达 100B 级别。百灵大模型今日宣布 Elephant Alpha 正是百灵模型 Ling-2.6-flash 的匿名测试版本。 官方表示,面对持续攀升的 Token 压力,Ling-2.6-flash 选择了一条不同的技术路径:不是单纯依赖更长输出换取更高分数,而是围绕推理效率、Token 效率与 Agent 场景表现进行系统性优化,在保持竞争力智能水平的同时,尽可能做到更快、更省和更适合真实业务场景。 Ling-2.6-flash 的核心能力体现在三个方面: 混合线性架构,释放推理效率:通过引入混合线性架构,模型从底层优化计算效率,在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s,Prefill 吞吐达到 N
