美国版权局是有限的考虑更新法律,直接应对生成式人工智能。
我谷歌、微软、OpenAI以及其他与人工智能相关的公司都极力反对任何改变。
A16z表示,为数据付费意味着每年要支付“数百亿或数千亿美元”的版权费。
世界上最大的科技公司真的不希望为训练其生成人工智能工具背后的模型所需的大量受版权保护的数据付费。
在美国版权局考虑生成式人工智能新规则的评论期,meta、微软、谷歌、苹果、OpenAI和Andreessen Horowitz等公司,以及新闻机构、媒体机构和相关个人,在近1.1万名评论者中。版权局在其通知中要求就创建许可制度或其他程序提供意见,以“奖励版权所有者和/或创作者在训练人工智能模型中使用他们的作品”。
本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.
大多数科技公司似乎都同意,被要求为从互联网上抓取的大量受版权保护的材料付费,并用于训练大型语言模型,这些模型背后的人工智能工具包括meta的Llama、谷歌的Bard和OpenAI的ChatGPT,这将为这项技术的发展创造一个不可能的障碍。
meta在评论中写道:“生成式人工智能模型不仅需要大量的内容,还需要内容的多样性。”“可以肯定的是,人工智能开发商可能会与个别版权所有者达成协议,发展更广泛的合作伙伴关系,或者只是为了从诉讼的威胁中换取和平。但这类交易只会让人工智能开发者获得训练模型所需数据的一小部分。人工智能开发者也不可能授权其他关键类别的作品。”
谷歌、微软和OpenAI也提出了类似的论点——用于训练他们的模型的数据量是如此之大,以至于他们无法找到支付这些数据的方法。没有一家公司否认在未经版权所有者授权的情况下使用了受版权保护的材料。相反,他们普遍认为,将受版权保护的材料放在互联网上使其“公开可用”,因此是使用的公平目标。两家公司补充称,根据现行版权法,使用这些数据培训法学硕士构成“合理使用”。
谷歌将其用于训练像巴德这样的人工智能工具的受版权保护的材料称为“知识收获”,并辩称目前的版权法旨在允许这种收获发生。该公司认为,让谷歌这样的开发商对在培训中使用受版权保护的材料负责,“将给人工智能开发者带来沉重的责任”,并补充说,生成式人工智能是关于“思想的自由流动”。
此外,就风险投资公司安德森·霍洛维茨(Andreessen Horowitz)而言,它和其他投资者已经向人工智能热潮投入了数十亿美元,这应该足以成为不制定任何有利于版权所有者的新规则的理由。
A16z写道,这项投资“基于这样一种理解,即根据现行版权法,任何必要的复制都是允许的。”该公司表示,颠覆这种理解或假设,“将危及未来对人工智能的投资”。它还认为,在AI中使用版权作品的任何许可制度都是没有意义的,因为可能欠内容所有者大量的钱。
A16z写道:“在任何许可框架下,向个人版权所有者支付的费用都不是微不足道的,人工智能开发者每年要支付数百亿或数千亿美元的版税。”
与此同时,新闻集团、Getty、WME、甚至《绝命毒师》(Breaking Bad)的创作者文斯·吉利根(Vince Gilligan)等大多数参与人工智能模型训练材料制作的实体和个人,都支持更新版权规则,为人工智能工具提供保护和付费。
目前,几乎没有办法阻止受版权保护的内容从互联网上被抓取并用于创建法学硕士;版权法并没有解决这个问题。作家、视觉艺术家甚至开发者已经在起诉OpenAI、微软和meta等公司,因为他们的原创作品在未经他们同意的情况下被用于培训这些公司的人工智能工具。
你是一名技术员工,还是其他有见解或有建议的人?联系Kali Hays: khays@insider.com,通过安全消息应用程序Signal(949-280-0267),或通过DM on X/Twitter (@hayskali)。使用非工作设备进行接触。