本科论文
版权问题终究会是决定 AI 能走多远的其中一个关键因素。 打开凤凰新闻,查看更多高清图片 「实锤」终于来了。 今年 7 月,OpenAI 和 Meta 被三位美国作家 Sarah Silverman、Christopher Golden 和 Richard Kadrey 起诉,称两家公司在未经作者同意的情况下,把他们的书用作素材训练大模型。 证据? 在 OpenAI 案件里,原告们输入提示词后,ChatGPT 能够总结出他们的书的内容。 演员、作者 Sarah Silverman 和她的自传,输入提示词后,OpenAI 可呈现该书总结,图片来自 Vulture 在 Meta 案件中,Meta 大模型 LLaMA 的论文里就写着,它训练数据包括一个由 EleutherAI 整理的、名为「ThePile」的素材。 「ThePile」中又包含了一个名为「Books3」的数据集,它的内容正是线上盗版图书资源库 Bibliotik 的数据。 当时,原告们提出的证据还相对「间接」。 直到现在,作家和程序员 Alex Reisner 正式揭露,Meta 的大模型背后到底都盗用了哪些作家的什么书籍。...