英伟达:Fugatto可以创造出前所未有的声音
11月26日消息,英伟达表示,其新的AI音乐编辑器能够创造“前所未有的声音”,比如会发出喵喵声的小号。这个工具名为Fugatto,它能够使用从未接受过训练的文本和音频输入来生成音乐、声音和语音。
正如下面嵌入的视频所示,这让Fugatto能够根据奇特的提示组合歌曲,比如“创建一个发出嚎叫、吠叫然后是带有狗叫声的电子音乐。”
公司分享的其他一些例子包括根据描述产生独特的音效,如“深沉、隆隆作响的低音脉冲与间歇性的高调数字鸣叫相结合,就像一个巨大的有感知的机器醒来的声音。”
它甚至可以改变某人的声音,改变他们的口音或给他们不同的语调,如愤怒或平静。还有编辑音乐的方法,因为Fugatto可以隔离歌曲中的人声,添加乐器,甚至通过用歌剧歌手替换钢琴来改变旋律。
与公告一同发布的一篇论文展示了英伟达称Fugatto受过训练的所有数据集的长列表,其中一个包括来自BBC的声音效果库。
市场上已经有其他几个AI音频工具,包括Stability AI、OpenAI、Google DeepMind、ElevenLabs和Adobe的产品,但没有声称能创造全新且未曾听闻的声音的工具。一些AI初创公司甚至因为他们的音乐创作工具面临版权诉讼,而最近的一份报告发现,英伟达和其他公司利用数千个YouTube视频的字幕训练AI模型。
为了构建Fugatto,英伟达表示研究人员必须汇集一个包含数百万音频样本的数据集。然后他们创建了指令,这大大扩展了模型可以执行的任务范围,同时实现更准确的性能并启用新任务,无需额外的数据。英伟达没有说这个工具何时或者是否将广泛可用。
相关阅读
- 罗克韦尔自动化与微软拓展合作伙伴关系,运用生成式 AI 技术提升生产力并缩短产品上市时间
- 比特周报:ChatGPT当选《自然》杂志年度科学人物,全球AI假新闻网站7个月内激增十几倍
- 比特网早报:AMD宣布收购开源软件公司Brium,微软开源发布Athena智能体
- 长飞先进武汉基地首片晶圆正式下线
- 美光回应中国区业务调整:公司将在全球范围内停止未来移动 NAND 产品的开发
- 逐梦苍穹,巅峰对决!2025中关村地区航空航天科技节暨第九届全国青少年无人机大赛(北京市赛)北京大学附属中学分赛场成功举办
- 日产给电车装上太阳能板:每天晒晒太阳就能多跑23公里
- 无人驾驶出租车在上海开跑:起步价14元3公里
- 上下文长度对大模型意味着什么?一文看懂
- BOE(京东方)商显解决方案闪耀ISE2026 屏之物联谱写全球化出海新篇