热门资讯

OpenAI推出声音克隆新技术：复刻你的声音仅需15秒

互联网来源：快科技 2024-03-31 15:59:33

据媒体报道，OpenAI公司最近推出了一项革命性的声音克隆技术——“Voice Engine”。

据悉，Voice Engine通过文本输入和15秒的音频样本，便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。

这一技术的研发始于2022年，并已应用于公司现有的文本转语音API和Read Aloud功能中的预设语音。

OpenAI认为，Voice Engine技术对于多个领域具有重大意义。在阅读辅助和语言翻译方面，它能够提供更为自然的语音输出，增强用户体验。

同时，该技术对于言语障碍患者来说更是一大福音，能够帮助他们更顺畅地交流。例如，在布朗大学的一个试点项目中，该技术成功用于创建从学校项目录制的音频中提取的语音克隆，有效帮助了言语障碍学生。

然而，鉴于合成语音技术可能存在的滥用风险，OpenAI目前仅对少数可信合作伙伴开放小规模测试。通过这种方式，公司旨在深入了解技术的潜在应用，并评估可能带来的风险。

OpenAI也希望通过此举引发社会对合成语音负责任部署的广泛讨论，共同探索如何适应这一新型技术。

此外，为了确保技术的安全使用，OpenAI还采取了一系列安全措施。这些措施包括使用水印技术追踪音频来源，以及对系统的使用方式进行主动监控。

当产品正式推向市场时，公司将设立一个“禁止语音列表”，以检测并阻止与名人声音过于相似的人工智能生成声音，从而避免潜在的版权和隐私问题。

延伸阅读

MiniMax冲击港股阿里米哈游腾讯加持

央广网报道，通用人工智能公司MiniMax（稀宇科技）今日已通过港交所上市聆讯，有望成为从成立到完成IPO历时最短的AI企业。据悉，截至2025年9月30日，MiniMax持有现金结余10.46亿美元
年仅27岁出任腾讯AI首席科学家：高考数学睡觉错失全省第一

据媒体报道，近日，年仅27岁的姚顺雨出任腾讯AI首席科学家。腾讯升级大模型研发架构，新成立AI Infra部、AI Data部、数据计算平台部，全面强化其大模型的研发体系与核心能力。而姚顺雨出任“CE
OpenAI正式发布GPT-5.2！更实用：做表格、写PPT、敲代码等生产力大增

今天凌晨，OpenAI正式推出新一代大模型GPT-5.2，付费用户端及API同步开放。此举距上一代GPT-5.1发布不足一月，背后是谷歌Gemini 3引发的“红色警报”竞争压力——OpenAI此前紧

关注公众号：拾黑（shiheibook）了解更多

友情链接：

*文章为作者独立观点，不代表文娱排行榜立场

本文由 BT1207发表，转载此文章须经作者同意，并请附上出处( 文娱排行榜 )及本页链接。

原文链接 https ://www.yaorank.com/news/net/26681.html

OpenAI 声音克隆 Voice Engine