OpenAI展示语音生成模型Voice Engine
科技IT 2024-04-04 tfyge2424
4月1日消息,据外媒报道,OpenAI日前在官网展示了名为Voice Engine的AI模型,该模型可以根据用户提供的音频样本生成与原生相似的自然语音。
据悉,该公司于2022年底开发了这款模型。OpenAI使用它来支持ChatGPT功能,使客户能够通过语音命令与聊天机器人进行交互,并让聊天机器人大声朗读文本。此外,该公司去年还通过一个试点项目向有限数量的合作伙伴提供了这种模式。
语音引擎可以分析用户声音的样本,然后生成与之非常相似的合成语音。根据OpenAI的说法,人工智能只需要15秒的音频来模仿说话者。该公司在一篇博客文章中将语音引擎描述为“小模型”,这表明它需要有限的计算基础设施来运行。
OpenAI还没有公开提供语音引擎。然而,该公司在2023年底向有限数量的合作伙伴开放了该模型。OpenAI表示,这些合作伙伴已经成功地将语音引擎应用于为教育内容生成画外音和翻译视频等任务。
该公司表示,试点项目的参与者同意,只有在获得许可的情况下才能复制个人的声音。此外,客户还需要在人工智能生成的语音中添加披露信息,说明其为合成语音。
OpenAI的工作人员在详细介绍Voice Engine的博客文章中写道:“我们希望就负责任地部署合成声音,以及社会如何适应这些新功能展开对话。基于这些对话和这些小规模测试的结果,我们将做出更明智的决定,决定是否以及如何大规模部署这项技术。”
The End
相关阅读
- 晶泰科技在港交所主板挂牌上市,AI+机器人打造18C第一股
- Aruba与NetApp合作提升IT产品
- 小马智行与广州公交集团达成战略合作,共推自动驾驶商业化
- 贸泽推出全新电子书 提供无线射频设计和应用的工程设计指南
- 比特网早报:加快建设人工智能教育大模型,阿里巴巴将首次展示AIStack大模型一体机
- 创投集团合作子基金投资企业耀宇视芯发布国内首颗空间定位协处理芯片,助力VR/AR行业破局
- 英伟达正式发布RTX 4090 D 保持RTX 40系列产品线完整性
- Rho:中国引领 2025 上半年全球新能源汽车销量,550 万辆、同比增长 32%
- 比特早报:三季度中国中小企业发展指数回升,谷歌云发布新AI搜索功能
- 又一款中大手全能鼠标,ATK 蜻蜓A9系列,百元屠榜!