OpenAI推出声音克隆新技术:复刻你的声音仅需15秒
据媒体报道,OpenAI公司最近推出了一项革命性的声音克隆技术——“Voice Engine”。
据悉,Voice Engine通过文本输入和15秒的音频样本,便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。

这一技术的研发始于2022年,并已应用于公司现有的文本转语音API和Read Aloud功能中的预设语音。
OpenAI认为,Voice Engine技术对于多个领域具有重大意义。在阅读辅助和语言翻译方面,它能够提供更为自然的语音输出,增强用户体验。
同时,该技术对于言语障碍患者来说更是一大福音,能够帮助他们更顺畅地交流。例如,在布朗大学的一个试点项目中,该技术成功用于创建从学校项目录制的音频中提取的语音克隆,有效帮助了言语障碍学生。
然而,鉴于合成语音技术可能存在的滥用风险,OpenAI目前仅对少数可信合作伙伴开放小规模测试。通过这种方式,公司旨在深入了解技术的潜在应用,并评估可能带来的风险。
OpenAI也希望通过此举引发社会对合成语音负责任部署的广泛讨论,共同探索如何适应这一新型技术。
此外,为了确保技术的安全使用,OpenAI还采取了一系列安全措施。这些措施包括使用水印技术追踪音频来源,以及对系统的使用方式进行主动监控。
当产品正式推向市场时,公司将设立一个“禁止语音列表”,以检测并阻止与名人声音过于相似的人工智能生成声音,从而避免潜在的版权和隐私问题。
- 
                                    Local-NotebookLM – 开源PDF转播客AI工具,自定义音频Local-NotebookLM是什么Local-NotebookLM 是开源的本地 AI 工具,能将 PDF 文档转换为引人入胜的音频内容,如播客、访谈、辩论等。支持多种输出格式和内容风格,用户可以 
- 
                                    Agent Kit – OpenAI推出的AI Agent开发工具Agent Kit是什么Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布 
- 
                                    股价飙升35% AMD与OpenAI达成重磅合作:卖出数百亿美元显卡前不久NVIDIA宣布向OpenAI投资1000亿美元,然而今天OpenAI宣布了更重磅的消息,他们与AMD达成战略合作,将购买数百亿美元的AMD显卡。根据双方的声明,OpenAI将在未来数年部署超过 
关注公众号:拾黑(shiheibook)了解更多
友情链接:
                        关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
                        安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
                    
 关注网络尖刀微信公众号
            关注网络尖刀微信公众号随时掌握互联网精彩

 
                





 BT1207
                BT1207
             
                 
                 
                