路线图
- 回合检测 目标是逼近真人对话:基础能力是AI何时开始回复、何时附和、何时认为自己被打断,高级能力是AI主动打断接话
- 多说话人
- 多说话人识别模型
- LLM拿到说话人信息怎么用
- TTS控制
- 多句合成的风格一致性
- 副语言信息控制/TTS接口设计/触发条件
- 应用
- 语音工作界面 用户触发AI调用工具做事,类似于语音的openclaw
- 机器人对话
- 心理咨询
- API测试
- Benchmarking
- 更多模型的适配
- 回合检测模型 easyturn smartturn turnsense
- TTS模型 豆包TTS 阿里百炼TTS...