更强多模态 Agent 能力(公测中)
能力多面手,应用场景丰富
真人级别的语音对话交互体验
文图视频全模态表征,向量检索最佳选择
音画高精同步,多人多话对白,影视级叙事
前端、Bugfix 能力强,全量透明 Cache
快速定制专属 AI 音色
故事剧情模式,支持多人剧情互动
多图稳定融合、主体一致、4k 高清、推理升级
复杂场景识别效果和准确率提升
生成自然、高保真、个性化语音
一键文本转双播,即刻生成超拟真语音播客