跳转至

路线图

  • 回合检测 目标是逼近真人对话:基础能力是AI何时开始回复、何时附和、何时认为自己被打断,高级能力是AI主动打断接话
  • 多说话人
    • 多说话人识别模型
    • LLM拿到说话人信息怎么用
  • TTS控制
    • 多句合成的风格一致性
    • 副语言信息控制/TTS接口设计/触发条件
  • 应用
    • 语音工作界面 用户触发AI调用工具做事,类似于语音的openclaw
    • 机器人对话
    • 心理咨询
  • API测试
  • Benchmarking
  • 更多模型的适配
    • 回合检测模型 easyturn smartturn turnsense
    • TTS模型 豆包TTS 阿里百炼TTS...