OpenAI与新闻出版商签订协议,每年最高支付500万美元购买授权
1月10日消息,据外媒报道,随着新闻出版商与人工智能公司签订协议,用新闻故事训练他们的模型,OpenAI等公司愿意为受版权保护的信息支付的价格正在浮出水面。
据The Information报道,OpenAI每年提供100万至500万美元的版权新闻文章授权,以训练其人工智能模型。这是人工智能公司计划为授权材料支付多少费用的迹象之一。与此同时,最近的一份报告称,苹果正在寻求与媒体公司合作,将内容用于人工智能训练,并在多年期间提供至少5000万美元的数据。
报道指出,目前的大模型的训练数据主要是来自互联网的信息。虽然一些人工智能模型没有透露它们是如何获得训练数据的,但通常可以获得有关使用了哪些数据集或网络爬虫的信息。训练数据集的定价因提供者、大小和数据集的内容而异。一些数据提供程序,如LAION,是开源的,完全免费的,被Stable Diffusion等模型使用。人工智能开发人员还经常设置网络爬虫,从互联网上获取数据,以帮助训练他们的模型。
但这种做法现在面临着重大挑战。首先,OpenAI的GPT爬虫已经被一些公司阻止访问数据。另一方面,一些组织认为对他们的数据进行培训构成侵犯版权。
合作伙伴关系让人工智能公司避免了这些问题,在过去的一年里,这已经成为一种更普遍的做法。
OpenAI和苹果并不是唯一希望与新闻机构合作的人工智能开发商。据报道,谷歌向《纽约时报》、《华尔街日报》和《华盛顿邮报》的高管展示了一款名为Genesis的人工智能工具,该工具可以收集事实并发布新闻报道。与此同时,一些新闻机构在新闻编辑室使用了生成式AI工具,结果好坏参半。
相关阅读
- 为旌科技黄智:小而美的智能AI视觉芯片是怎么炼成的
- 大模型降本增效,稀疏注意力机制的魔力在哪?
- 罗克韦尔自动化发布《智能制造现状报告:生命科学版》:生命科学制造业 AI 采用率激增,应对人才短缺、风险加剧及质量承压的挑战
- 安富利举办产业创新工作坊,赋能行业的数字化转型升级
- 宜建尽建!江苏常州到2025年,力争分布式光伏装机达4GW
- 国家能源局:新型储能发展迅速 已投运装机超3000万千瓦
- TE Connectivity携一站式能源解决方案亮相第十七届(2024)国际太阳能光伏与智慧能源(上海)展览会
- 致企业:边缘AI部署,从未如此简单
- 受企业用能、消纳及组件价格影响,59MW分布式光伏延期!
- 2025Q2中国智能手机市场:华为出货量第一,荣耀同比大跌19%!