综合
人工智能正在引起作者的恐慌现在法院介入了

小说家道格拉斯·普雷斯顿(Douglas Preston)刚开始尝试ChatGPT时,给这款人工智能软件出了一个难题:它能否根据自己书中的人物创作一首原创诗歌?

普雷斯顿回忆说:“它是一首用抑扬格五音步写的很棒的诗。结果令人印象深刻,也令人担忧。“真正让我惊讶的是它对这个角色的了解程度;远比它从互联网上收集到的要多,”普雷斯顿说。

这位冒险作家怀疑聊天机器人不知怎么吸收了他的作品,大概是作为训练过程的一部分,在这个过程中,人工智能模型吸收了大量数据,然后将其合成为看似原创的内容。

“那是一种非常令人不安的感觉,”普雷斯顿说,“就像回到家,发现有人进过你的房子,拿走了东西。”

这些担忧导致普雷斯顿签署了一项集体诉讼,指控ChatGPT背后的开发商OpenAI侵犯版权,OpenAI是不断发展的人工智能行业的主要参与者。(OpenAI最近的估值为800亿至900亿美元。)

除了普雷斯顿之外,还有其他许多知名作家,包括约翰·格里沙姆、乔纳森·弗兰岑、乔迪·皮考特和乔治·r·r·马丁。乔治·r·r·马丁是出了名的迟迟不出版《权力的游戏》的作者,普雷斯顿说,他之所以加入诉讼,是因为粉丝们使用ChatGPT抢先制作了他的系列小说的最后一本书。

OpenAI方面则认为,训练人工智能系统属于合理使用保护,特别是考虑到人工智能将底层训练数据转换为新东西的程度。在一封电子邮件声明中,OpenAI的一位发言人告诉《纽约时报》,该公司尊重作者的权利,并认为他们应该“从人工智能技术中受益”。

该发言人表示:“我们正在与包括作家协会在内的世界各地的许多创作者进行富有成效的对话,并一直在合作,以了解和讨论他们对人工智能的担忧。”“我们乐观地认为,我们将继续找到互利的方式,共同努力,帮助人们在丰富的内容生态系统中利用新技术。”

然而,出版业正在反击,因为它认为软件热潮让任何有WiFi的人都能自动生成大量文本。除了普雷斯顿的诉讼,其他一些作者团体也在对OpenAI提起集体诉讼。

“每个人都意识到,他们的数据、信息和创造力被吸收的程度有多高,”《出版商周刊》(Publishers Weekly)的编辑埃德·纳沃特卡(Ed Nawotka)说。业内存在一定程度的“极度恐慌”。

在最近的两起诉讼中,莎拉·西尔弗曼(Sarah Silverman)指控OpenAI以及meta——Facebook的母公司和一家主要的人工智能开发商——侵犯了版权。此后,这两家公司一直在努力让西尔弗曼的大部分案件被驳回。

在最近的另一起诉讼中,Paul Tremblay(《世界尽头的小屋》)和Mona Awad(《兔子》)起诉OpenAI侵犯版权——OpenAI公司也试图让这一诉讼基本上被驳回——而Michael Chabon(《意第语警察联盟》)是另外两起针对OpenAI和meta的诉讼的原告。

今年7月,美国作家协会(Authors Guild)——一个专业的贸易组织,而不是工会——给几家科技公司发了一封公开信,呼吁在作家的作品被用于训练人工智能模型时,获得同意、信任和公平的补偿。签名者包括玛格丽特·阿特伍德、丹·布朗、詹姆斯·帕特森、苏珊娜·柯林斯、罗克珊·盖伊和Celeste Ng。

除此之外,好莱坞编剧最近进行了近5个月的罢工,导致了关于使用人工智能生成剧本的新规定。(另一场仍在进行的罢工发现,演员们围绕自己对人工智能的担忧团结起来。)

普雷斯顿参与的诉讼中,包括作家协会在内的其他17名原告声称,OpenAI“未经许可或考虑”就复制了作者的作品,目的是训练人工智能程序,这些程序现在与这些作者争夺读者的时间和金钱。

《哥伦比亚人报》正在成为当地家族拥有新闻机构的罕见例子。立即订阅以支持本地新闻并帮助我们建立工作室 ng社区。

该诉讼还对ChatGPT的衍生作品提出了质疑,即“基于、模仿、总结或改写原告作品的材料,并损害了这些作品的市场。”

原告正在为他们失去的许可机会和“市场篡夺”寻求损害赔偿,并代表美国小说作者寻求禁止未来此类行为的禁令,这些作家的版权作品被用来训练OpenAI软件。

“他们没有征求我们的许可,也没有补偿我们,”普雷斯顿在谈到OpenAI时说。“他们所做的是创造一个非常有价值的商业产品,可以复制我们的声音。这基本上是在大规模窃取我们的创意成果。”

他补充说,由于原告的书并不是在开放网络上免费提供的,OpenAI“几乎可以肯定”是通过文件共享平台LibGen等所谓的盗版网站获取的。(该诉讼重申了这种怀疑,将其归咎于“独立的人工智能研究人员”。)

OpenAI拒绝回答原告的书籍是否是ChatGPT训练数据的一部分,还是通过LibGen等文件共享网站访问的问题。在提交给美国专利商标局的一份声明中,OpenAI表示,现代人工智能系统有时会在包括版权作品在内的公开数据集上进行训练。

据《大西洋月刊》报道,与此同时,meta在一个名为“Books3”的盗版电子书语料库上训练了其ChatGPT的竞争对手LLaMA。该数据集的可搜索版本表明,LLaMA以上述各种诉讼中几乎所有被称为原告的个人所写的书籍为基础。

《洛杉矶时报》员工的作品也包括在内。meta没有回应时报关于LLaMA培训方式的置评请求。

撇开训练数据的具体来源不谈,许多作者都担心这项技术将把他们的行业引向何方。

哈利·博斯(Harry Bosch)系列犯罪小说的作者、作家协会诉讼的另一位原告迈克尔·康纳利(Michael Connelly)将这些担忧归结为控制问题:“控制你自己的作品,你自己的财产。”

康纳利从来没有决定过他的书是否会被用来训练人工智能,他说,但如果他被问到——即使有钱在桌子上——他可能会选择退出。ChatGPT编写一个非官方的博世续集的想法让他觉得是一种违反;他说,即使亚马逊把这部剧改编成电视剧,他对剧本和选角也有一定的控制权。

“这些角色属于我们,”康纳利说。“它们来自我们的头脑。我甚至在遗嘱里写了这样的话:在我死后,没有其他作家能接过哈利·博斯的火炬。他是我的,我不想让别人讲述他的故事。我当然不想让机器来告诉我。”

但法律是否允许机器这样做是另一个问题。

针对OpenAI的各种诉讼指控其侵犯了版权。但是版权法——尤其是合理使用,即当受版权保护的作品可以被合并到其他活动中,比如为了教育或批评的目的——仍然没有提供一个简单明了的答案来解决这些诉讼。

Klaris律师事务所的合伙人、知识产权律师Lance Koonce说:“我们现在在判例法上有一种拉扯式的局面。”他指出,最近最高法院的两起案件提供了相互竞争的合理使用模式。

在“作家协会诉谷歌”一案中,法院裁定谷歌被允许将数百万本受版权保护的图书数字化,以使它们能够被搜索到。在另一起安迪·沃霍尔基金会视觉艺术公司诉戈德史密斯案中,法院裁定这位名义上的波普艺术家将摄影师的作品纳入自己的艺术作品并不属于合理使用,因为沃霍尔的艺术作品是商业性的,与原始照片具有相同的基本目的。

Koonce说:“这些人工智能案例——尤其是作家协会(Authors Guild)针对OpenAI的案例——就陷入了这种紧张状态。”

OpenAI在其专利局的声明中辩称,训练人工智能软件使用受版权保护的作品“本身不应损害受版权保护作品的市场或价值”,因为这些作品是由软件而不是真实的人消费的。

在法律途径之外,利益相关者已经在为这种紧张局势提出解决方案。

人工智能通讯平台Personal的首席执行官苏曼·卡努甘蒂(Suman Kanuganti)说。他说,科技行业可能会采用某种归属标准,允许为人工智能训练数据做出贡献的人得到识别和补偿。

“一旦你用已知的、经过验证的数据单元构建了模型,那么从技术上讲,这就不是一个挑战,”Kanuganti说。“一旦你解决了这个问题……经济联系就会变得更容易。”

冒险小说家普雷斯顿也认为,也许还有前进的道路。

他说,通过一个集中的清算所将图书授权给软件开发者,可以为作者提供新的收入来源,同时也为人工智能公司提供高质量的培训数据。他补充说,作家协会曾试图与OpenAI建立这样的安排,但双方未能达成协议。(OpenAI拒绝讨论此类对话。)

“我们试图让他们真诚地与我们坐下来;我们完全不反对人工智能,”普雷斯顿说。“这不是零和游戏。”

点击分享到

热门推荐