OpenAI推出声音克隆新技术:复刻你的声音仅需15秒
据媒体报道,OpenAI公司最近推出了一项革命性的声音克隆技术——“Voice Engine”。
据悉,Voice Engine通过文本输入和15秒的音频样本,便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。
这一技术的研发始于2022年,并已应用于公司现有的文本转语音API和Read Aloud功能中的预设语音。
OpenAI认为,Voice Engine技术对于多个领域具有重大意义。在阅读辅助和语言翻译方面,它能够提供更为自然的语音输出,增强用户体验。
同时,该技术对于言语障碍患者来说更是一大福音,能够帮助他们更顺畅地交流。例如,在布朗大学的一个试点项目中,该技术成功用于创建从学校项目录制的音频中提取的语音克隆,有效帮助了言语障碍学生。
然而,鉴于合成语音技术可能存在的滥用风险,OpenAI目前仅对少数可信合作伙伴开放小规模测试。通过这种方式,公司旨在深入了解技术的潜在应用,并评估可能带来的风险。
OpenAI也希望通过此举引发社会对合成语音负责任部署的广泛讨论,共同探索如何适应这一新型技术。
此外,为了确保技术的安全使用,OpenAI还采取了一系列安全措施。这些措施包括使用水印技术追踪音频来源,以及对系统的使用方式进行主动监控。
当产品正式推向市场时,公司将设立一个“禁止语音列表”,以检测并阻止与名人声音过于相似的人工智能生成声音,从而避免潜在的版权和隐私问题。
-
OpenAI董事长:行业正处于AI泡沫中 许多人会损失惨重
据媒体报道,OpenAI董事长布雷特·泰勒(Bret Taylor)近日表示,人工智能行业目前正处在泡沫阶段,并预计将有许多投资者和企业遭受重大损失。泰勒同时担任AI智能体创业公司Sierra的CEO
-
OpenAI新论文揭示AI模型出现幻觉的原因:并非神秘故障而是模型训练的奖励机制问题
目前人工智能模型普遍存在幻觉问题,所谓幻觉就是模型偶尔会自信满满地输出错误信息,此前曾有报道称连研究人员都搞不清幻觉的根源,因为模型在运行中属于黑盒模式。不过 OpenAI 研究团队最新发布的论文已经
-
GPT-5发布后ChatGPT Plus用户权限被缩减引起用户抗议 萨姆奥特曼亲自道歉
本周五 OpenAI 发布大家期待已久的 GPT-5 系列模型,该模型在推理、编码和工具调用等方面取得重大进步,而且所有用户都可以免费通过 ChatGPT 使用 GPT-5 模型。然而根据 ChatG
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 参阅所有装备均为国产现役主战装备
- 混元自研深度思考模型T1正式发布:吐字快、能秒回
- 谷歌正在开发邮件盾(Shielded Email) 为用户生成随机邮箱注册账号隐藏真实邮箱
- 微软收购动视暴雪后状况频发 外媒:游戏质量才是关键
- 宠物驱虫哪家好
- 优拾玖商城 v2.0.3最新版本2022下载地址
- 工资管理系统 1.0.0.0最新版本2022下载地址
- 周杰伦抵港彩排明晚演唱会 张学友惊喜现身探班
- 共享充电宝app 1.0.0最新版本2022下载地址
- FlexCell表格控件 5.6.5最新版本2022下载地址
- MC部落 2.1最新版本2022下载地址
- 中国环保生态修复 v1.0最新版本2022下载地址