OpenAI开发双向语音模型:被打断也能秒回 让通话更自然顺畅
据媒体报道,OpenAI正在研发一种全新的语音模型,旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于,当用户在AI说话过程中打断系统时,AI能够实时调整回应,而不是像现在这样突然停止。

目前ChatGPT的高级语音模式采用的是回合式对话机制,用户必须先说完话,AI才会处理语音并生成回答。如果用户在AI发言时插入"okay"或"mm-hm"等简短回应,系统通常会直接停止,无法像正常对话那样继续推进交流。
为解决这一问题,OpenAI正在开发的BiDi(双向语音模型)能够持续处理说话者的语音输入,因此在被打断时可以立即调整回应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。
这项技术目前仍处于开发阶段。据知情人士透露,原型模型在持续对话几分钟后容易出现故障,有时甚至会发出不自然的声音。OpenAI研究人员原本希望今年第一季度发布BiDi,但目前最新的发布时间可能推迟到第二季度或更晚。
OpenAI认为,如果语音模型能够在性能上接近文本模型,AI的使用范围将进一步扩大,因为大多数人更习惯与AI进行语音交流,而不是输入文字。BiDi模型在客服场景中可能尤其有价值。
例如,当顾客与零售商的AI客服通话时,如果顾客在对话过程中临时决定选择换货而非退货,BiDi模型理论上可以让AI客服顺畅调整对话,而不会突然停止或出现混乱。
知情人士还透露,BiDi模型在调用外部工具和应用方面也更灵活。OpenAI此前表示,公司计划为未来一款主要通过语音交互的AI设备改进语音模型,并考虑开发一款智能音箱,通过语音指令即可查看邮件或预订服务。
-
抖音副总裁回应委员对AI手机助手误解:可提供测试版手机供调研了解
近日,全国政协委员李萌娇受访时称,建议完善针对手机AI助手权限的安全管理体系,保证既要快速发展、又能守住安全底线。她认为,目前手机AI助手存在过度收集个人信息的问题,需要制定行业标准、弥补技术漏洞,并
-
雷军推荐Xiaomi Tag:智能定位查找只要69元起
今天一早,小米创始人雷军发文推荐一个小产品——Xiaomi Tag。这是小米刚刚发布的防丢神器,也是小米第一款定位产品,是一款体积小巧的配件。尺寸为46.5*31*7.2mm,产品净重10g,支持IP
-
女子蹭完Wi-Fi借钱被拒掀翻店家桌子:连了你家Wi-Fi就得对我负责
3月3日消息,据国内媒体报道,2月27日,江西赣州发生了一件离谱的事,一名陌生女子向店主曾女士询问并连接店铺Wi-Fi使用二十余分钟后,竟以连了Wi-Fi店家需负责为由借100元。没想到,遭拒后当场打
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩
- 郭帆官宣!《流浪地球》第三部上下部剧本全部完稿
- 谷歌宣布Gemini AI支持MCP协议 将帮助AI模型调用外部资源提升实用性和灵活性
- 加币兑换人民币汇率2024年11月12日
- 福建高速发生交通事故7人死亡
- 银行拒不配合执行被罚百万
- 实况抓娃娃 v2.0.1最新版本2022下载地址
- 日元对人民币汇率2023年8月6日
- 优易幼儿园管理软件 2.2最新版本2022下载地址
- 金飞翼屏幕录像大师 5.30最新版本2022下载地址
- 供享同城配送 v1.1.7最新版本2022下载地址
- Finaldata(超级数据恢复) 2.0.2.428最新版本2022下载地址
- 超级图库管理软件单机版 3.9.18.7441最新版本2022下载地址







Diana Rider
