StepStar has launched the new-generation real-time voice large model StepAudio 2.5 Realtime, which supports emotion perception and persona customization.

ITHome

IT之家

May 8, 2026, 09:56 PM

IT之家 5 月 9 日消息，阶跃星辰昨晚发布了新一代实时语音大模型 StepAudio 2.5 Realtime，目前已全量上线，开发者可通过阶跃星辰开放平台接入使用。该模型定位于打造更具“活人感”的 AI 对话体验，重点围绕副语言感知、人设自定义与对话能力三个方向进行技术升级。 IT之家从官方获悉，StepAudio 2.5 Realtime 的核心突破在于其对“副语言”信息的处理能力。所谓副语言，指的是语调、语速、停顿乃至一声叹息或轻笑等文字以外的表达方式，这些细节恰恰是人类情感传递的主要载体。模型通过对这些元素的解读，可以感知对话者的情绪状态与潜在意图，比如从低沉的声线中察觉疲惫，或是从急促的语气里识别出烦躁情绪，并据此动态调整回应的语气与策略，旨在降低交互的生硬感，使其更像与真人交谈。在人设灵活性方面，StepAudio 2.5 Realtime 将定义权完全交给用户。开发者可以通过 API，从性格特质、背景经历、个人好恶到语言习惯与对话边界，对 AI 角色进行精细化调节。这一能力的背后，是模型基于超过 10,000 个高质量原生人设，通过算法裂变生成的百万级人设特征矩