Meta 承认使用盗版书籍来训练 AI,却拒绝向作者做出适当补偿

Andrew2024-01-15 16:54:11

大型语言模型(LLM)技术近年来取得了巨大进步,但其背后却隐藏着版权纠纷的阴云。科技巨头们利用海量文本数据训练 LLM,其中难免会涉及到受版权保护的作品,招致作者和媒体组织的强烈抗议。



近日,Meta(前身为 Facebook)就因使用包含大量盗版书籍的“Books3”数据集训练其 LLAM 1 和 LLAM 2 模型而面临包括喜剧演员 Sarah Silverman 和作家 Richard Kadrey 在内的一众作者的集体诉讼。Meta 虽承认使用了 Books3 数据集,却拒绝向作者支付适当的补偿。


Books3 是一个包含 19.5 万本图书、总容量近 37GB 的文本数据集,由 AI 研究者 Shawn Presser 于 2020 年创建,旨在为改进机器学习算法提供更好的数据源。Meta 也将其用于训练自己的 LLAM 模型,然而 Books3 中包含大量从盗版网站 Bibliotik 爬取的受版权保护作品,使得 Meta 的行为面临法律风险。


IT之家注意到,Meta 的做法并非特例。此前,《纽约时报》也因 OpenAI 和微软使用其文章训练聊天机器人 ChatGPT 而对其提起诉讼。OpenAI 则辩称,不使用受版权保护的材料来训练 AI 模型“几乎不可能”,并要求法院驳回相关诉讼。Meta 同样否认故意侵犯版权,声称其使用 Books3 数据集属于合理使用范畴,无需获得许可、署名或支付补偿。


此外,Meta 还在对诉讼作为集体诉讼的合法性提出异议,拒绝向提起诉讼的作家或其他参与 Books3 争议的人士提供任何形式的经济“补偿”。


值得注意的是,Books3 数据集中的部分内容来自盗版网站 Bibliotik,该数据集在 2023 年被丹麦反盗版组织 Rights Alliance 要求下架,目前面临数字存档禁令。


消息来源:IT之家

法律meta
本作品采用《CC 协议》,转载必须注明作者和本文链接
编者按: 本公号发表过的关于数据执法跨境调取的相关文章: 微软起诉美国司法部:封口令违法! 网络主权的胜利?再评微软与FBI关于域外数据索取的争议 微软与FBI关于域外数据索取的争议暂告一段落 美国Cloud Act法案到底说了什么 Cloud Act可能本周就得以通过! 修改版的Cloud Act终成为法律 欧盟推出自己的“Cloud Act” 美国快速通过Cloud法案 清晰明确数据主权战
大型语言模型(LLM)技术近年来取得了巨大进步,但其背后却隐藏着版权纠纷的阴云。科技巨头们利用海量文本数据训练 LLM,其中难免会涉及到受版权保护的作品,招致作者和媒体组织的强烈抗议。
谷歌推出针对 Android 应用程序的漏洞赏金计划
爱尔兰隐私监管机构认定,Facebook母公司Meta的广告和数据处理做法违反了欧盟隐私法,该公司被处以总额超过4亿美元的罚款。这笔罚款标志着爱尔兰监管机构对Meta进行的两项漫长调查结束。在周三的裁决中,DPC表示,Meta必须在三个月内使其数据处理业务符合规定。Meta于2021年从Facebook更名,该公司周三在一份声明中表示,计划对这一裁决提出上诉。该决定并不等于禁止个性化广告,企业可以继续使用Meta的平台向目标用户投放广告。
Neal Stephenson在 1992 年的赛博朋克小说《雪崩》中首次使用了“元宇宙”一词。它描述了一个可以使用化身探索的虚拟世界,为玩家提供完全身临其境的体验。今天,我们在 Roblox、Minecraft、Fortnite、Second Life 等大型多人在线角色扮演游戏 (MMORPG) 中看到了类似的世界,但这些游戏仍然远不及 Snow Crash 中描述的沉浸式体验。
该帖子说,目标包括记者、持不同政见者、专制政权的批评者、反对派的家人和人权活动家。这些监视是在长达一个月的调查中发现的,Meta公司在调查中发现了一些间谍组织,并将它们从平台上删除。 “这些公司是一个庞大产业的一部分,它们不分青红皂白地向任何客户提供侵入性软件工具和监控服务--不管它们的目标是谁,也不管它们可能促成的侵犯人权行为,”Meta的威胁破坏主管 David Agranovich和网络间
Facebook的母公司Meta因将该地区用户的个人数据转移到美国,被欧盟数据保护监管机构处以破纪录的13亿美元罚款。此次破纪录的罚款也是向其他组织发出的一个强烈信号,即对用户数据的侵权行为会带来严重的后果。但这两项均被EDPB驳回。Meta公司回应说,他们打算对裁决提出上诉,称罚款是 "不合理且不必要的",美国政府的数据访问准则与欧洲的隐私权之间存在着 "根本的法律冲突"。
近日,ALPHV / BlackCat勒索软件团伙声称访问到了大量敏感数据,包括某科技巨头处理特殊服务信息请求的方式以及特殊代理商的凭据。他们表示安全设备的使用并不安全,Casepoint的员工可能会将解密的驱动器留在电脑上数天甚至数周。据推测,该团伙获得了极其敏感的数据,比如特工和主管的姓名,以及与该行动有关的交易照片。
5月22日,欧盟数据保护监管机构对Facebook的母公司Meta处以了创纪录的12亿欧元罚款,因Meta非法将欧洲公民的个人数据传输到美国。这项罚款是欧盟自《通用数据保护条例》通过以来的最大一笔罚款,远超此前2021年7月以隐私违规为由对亚马逊处以的7.46亿欧元。Meta回应称,罚款“不合理且不必要”,打算对该裁决提出上诉。
MetaMask已向iOS用户发布警告,如果应用数据备份处于活动状态,苹果iCloud中会存储加密货币钱包的种子。
Andrew
暂无描述