文章主题:​

666AI工具大全,助力做AI时代先行者!

在2022年的12月,著名计算生物学家Casey Greene以及Milton Pividori展开了一场前所未有的实验。他们邀请了一位非科学家助理来协助提升三篇研究论文的质量。这位助手提出了一些富有创造性的建议,如在短短几秒钟内对文档的不同部分进行修订,以及对每份手稿花费约五分钟的时间进行审阅。令人惊喜的是,在这三篇生物学手稿中,他们的助手甚至在引用方程式时发现了一个错误。尽管这个实验的过程中并非一帆风顺,但是最终的手稿变得更加易于阅读,并且成本效益相当高,每份文件的费用不到0.50美元。

根据Greene和Pivdiari在2023年1月23日的预印本中阐述的观点,这款人工智能助手并非单独存在,而是一个名为GPT-3的AI算法。此算法自2020年面世以来,受到了广泛关注,被誉为生成式AI聊天机器人式的工具之一。无论是在要求撰写散文、诗歌、编写计算机代码,还是在编辑研究论文等方面,GPT-3都能生成让人深信不疑的流畅文本。

人工智能助手助力科研:GPT-3改变学术界的撰写格局

论文链接:https://www.biorxiv.org/content/10.1101/2023.01.21.525030v1

在众多工具中,最为知名的是被称为大型语言模型或LLM的ChatGPT,这是GPT-3的一个修订版,于2022年11月一经推出便声名鹊起,得益于其开放免费的特性,使得广大用户可以轻松获取和使用。与其他生成性AI不同,ChatGPT能够生成文本、图像以及声音等多媒体内容,其功能之强大,应用范围之广泛,无疑使其成为了当前最具代表性的AI工具之一。

在费城宾夕法尼亚大学的Pividori表示,他对这一技术进步印象深刻,因为它有可能极大地提升研究人员的工作效率。许多其他科学家也证实,他们已经将LLM用于编辑论文、编写代码以及集思广益。这种应用的普遍性表明,LLM在科研领域的应用越来越广泛,对于提高研究效率具有重要意义。

作为一名计算机科学领域的专家,Hafsteinn Einarsson博士每天都在使用语言模型(LLM)进行各种工作。他始于使用生成式对抗网络(GAN)的 GPT-3,但随后转而采用 ChatGPT,这大大提高了他的工作效率。ChatGPT不仅可以辅助他制作演示文稿、应对学生考试以及完成课程作业,还能够将学生的论文转化为正式的学术论文。此外,他还表示,许多人都将 ChatGPT 视为自己的数字秘书或助手,以便更有效地处理日常工作和任务。

LLMs,作为搜索引擎、编程助手以及聊天机器人的关键组成部分,正逐步发展壮大。它们能够与其他公司 chatbot 展开合作,从而获取更优质的产品价格。近期,由加利福尼亚州旧金山的企业 OpenAI 创立的 ChatGPT 发布了一项每月 20 美元的订阅服务。此服务承诺提供更快响应速度和优先体验新功能,尽管其试用期仍保持免费。值得一提的是,已投资 OpenAI 的全球知名科技公司微软,于2023年1月宣布进一步投资,预计规模约为100亿美元。随着技术的不断发展,LLMs 有望被广泛应用于通用文字和数据处理软件中。当前,生成式 AI 在社会中的应用前景看似光明,这源于它所代表的处于起步阶段的技术在当今社会中具有巨大潜力。

LLM 的出现引发了公众的广泛关注,这不仅是因为它有可能让人们返回虚假信息,而且还因为人们担心人工智能生成的文本会被误认为是自己的创作。Nature 在向研究人员询问关于聊天机器人(如 ChatGPT)的潜在应用时,研究人员们既兴奋又担忧。奥罗拉科罗拉多大学医学院的 Greene 警告说,如果认为这项技术具有改变世界的潜力,那么我们必须对此保持警惕。事实上,研究人员指出,未来法规和指南如何限制 AI 聊天机器人的使用将在很大程度上决定其发展前景。

流利但不真实

有部分研究者主张,在有监督的情况下,LLMs 能够有效地加速论文的撰写以及相关资助项目的推进。例如,瑞典哥德堡萨尔格伦斯卡大学的神经生物学家 Almira Osmanovic Thunstr?m,他与他人合作发表了一篇以 GPT-3 为实验对象的手稿。他认为,通过这种方式,科学家们可以避免花费大量时间撰写冗长的资助申请介绍。换言之,这种方法使得 LLMs 在加速论文撰写的过程中具有显著优势。

人工智能助手助力科研:GPT-3改变学术界的撰写格局

论文链接:https://hal.science/hal-03701250

总部位于伦敦的软件咨询公司 InstaDeep 的研究工程师 Tom Tumiel 表示,他每天都使用 LLM 作为助手来帮助编写代码。「这几乎就像一个更好的 Stack Overflow。」他说,指的是一个流行的社区网站,程序员可以在该网站上互相回答问题。

但研究人员强调,LLMs 在回答问题时根本不可靠,有时会产生错误的回答。「当我们使用这些系统来产生知识时,我们需要保持警惕。」Osmanovic Thunstr?m 说。

这种不可靠性融入了 LLM 的构建方式。ChatGPT 及其竞争对手通过学习庞大的在线文本数据库中的语言统计模式来工作——包括任何不真实、偏见或过时的知识。当 LLM 收到提示时(例如 Greene 和 Pividori 精心设计的重写部分手稿的请求),他们只是逐字吐出任何在文体上似乎合理的方式来继续对话。

结果是 LLM 很容易产生错误和误导性信息,特别是对于他们可能没有多少数据可以训练的技术主题。LLMs 也无法显示其信息的来源;如果被要求撰写学术论文,他们会编造虚构的引文。「不能相信该工具能够正确处理事实或生成可靠的参考资料。」Nature Machine Intelligence 杂志 2023 年 1 月份在 ChatGPT 上发表的一篇社论指出。

有了这些警告,ChatGPT 和其他 LLM 可以成为研究人员的有效助手,这些研究人员具有足够的专业知识来直接发现问题或轻松验证答案,例如计算机代码的解释或建议是否正确。

但是这些工具可能会误导不明真相的用户。例如,2022 年 12 月,Stack Overflow 暂时禁止使用 ChatGPT,因为网站版主发现自己被热心用户发送的大量不正确但看似有说服力的 LLM 生成的答案所淹没。这可能是搜索引擎的噩梦。

缺点能解决吗?

一些搜索引擎工具,例如以研究人员为中心的 Elicit,通过首先使用它们的功能来引导对相关文献的查询,然后简要总结引擎找到的每个网站或文档,从而解决 LLM 的归因问题——因此产生明显引用内容的输出(尽管 LLM 可能仍然错误地总结每个单独的文档)。

建立 LLM 的公司也很清楚这些问题。2022 年 9 月,谷歌子公司 DeepMind 发表了一篇关于名为 Sparrow 的「对话代理」的论文,该公司的首席执行官兼联合创始人 Demis Hassabis 后来告诉《时代》杂志,该论文将在今年内发布;该杂志报道说,谷歌的目标是开发包括引用消息来源的能力在内的功能。其他竞争对手,例如 Anthropic,表示他们已经解决了 ChatGPT 的一些问题。

一些科学家说,目前,ChatGPT 还没有接受足够专业的内容培训,无法对技术主题有所帮助。Kareem Carr 是马萨诸塞州剑桥市哈佛大学的生物统计学博士生,当他在工作中试用它时,他感到不知所措。「我认为 ChatGPT 很难达到我需要的特异性水平,」他说。(即便如此,卡尔说,当他向 ChatGPT 询问解决研究问题的 20 种方法时,它回复了胡言乱语和一个有用的想法——一个他从未听说过的统计术语,将他引向了学术文献的一个新领域。)

一些科技公司正在根据专业科学文献对聊天机器人进行培训——尽管它们也遇到了自己的问题。2022 年 11 月,拥有 Facebook 的科技巨头 Meta 发布了一个名为 Galactica 的 LLMs 项目,该项目接受过科学摘要培训,旨在使其特别擅长制作学术内容和回答研究问题。在用户让它产生不准确和种族主义之后,该演示已从公共访问中撤出(尽管其代码仍然可用)。「不再可能通过随意滥用它来获得一些乐趣。开心吗?」Meta 的首席人工智能科学家 Yann LeCun 在推特上回应批评。

安全与责任

Galactica 遇到了伦理学家多年来一直指出的一个熟悉的安全问题:如果没有输出控制,LLM 很容易被用来生成仇恨言论和垃圾邮件,以及可能隐含在其训练数据中的种族主义、性别歧视和其他有害联想。

密歇根大学科学、技术和公共政策项目主任 Shobita Parthasarathy 说,除了直接产生有毒内容外,还有人担心人工智能聊天机器人会从他们的训练数据中嵌入历史偏见或关于世界的想法,例如特定文化的优越性。她补充说,由于创建大型 LLM 的公司大多处于这些文化中,并且来自这些文化,因此他们可能很少尝试克服这种系统性且难以纠正的偏见。

OpenAI 在决定公开发布 ChatGPT 时试图回避其中的许多问题。它将其知识库限制在 2021 年,阻止其浏览互联网并安装过滤器以试图让该工具拒绝为敏感或有毒提示生成内容。然而,要实现这一点,需要人工审核员来标记有毒文本。记者报道说,这些工人的工资很低,有些人还受到了创伤。社交媒体公司也对工人剥削提出了类似的担忧,这些公司雇用人员来训练自动机器人来标记有毒内容。

OpenAI 的护栏并没有完全成功。2022 年 12 月,加州大学伯克利分校的计算神经科学家 Steven Piantadosi 在推特上表示,他已要求 ChatGPT 开发一个 Python 程序,以确定一个人是否应该根据其原籍国受到酷刑。聊天机器人回复了代码,邀请用户输入一个国家;如果那个国家是朝鲜、叙利亚、伊朗或苏丹,则打印「这个人应该受到折磨」。(OpenAI 随后关闭了此类问题。)

2022 年,一群学者发布了一个名为 BLOOM 的替代 LLMs。研究人员试图通过在少量高质量的多语言文本源上对其进行训练来减少有害输出。相关团队还完全开放了其训练数据(与 OpenAI 不同)。研究人员已敦促大型科技公司负责任地效仿这个例子——但尚不清楚他们是否会遵守。

一些研究人员表示,学术界应该完全拒绝支持大型商业 LLM。除了偏见、安全问题和受剥削的工人等问题外,这些计算密集型算法还需要大量能量来训练,这引发了人们对其生态足迹的担忧。更令人担忧的是,通过将思维转移给自动聊天机器人,研究人员可能会失去表达自己想法的能力。「作为学者,我们为什么会急于使用和宣传这种产品?」 荷兰拉德堡德大学大学的计算认知科学家 Iris van Rooij 在一篇博文中写道,敦促学术界抵制他们的吸引力。

进一步的混乱是一些 LLMs 的法律地位,这些 LLMs 是根据从互联网上抓取的内容进行培训的,有时权限不太明确。版权和许可法目前涵盖像素、文本和软件的直接复制,但不包括其风格的模仿。当这些通过 AI 生成的模仿品通过摄取原件进行训练时,就会出现问题。包括 Stable Diffusion 和 Midjourney 在内的一些 AI 艺术程序的创作者目前正在被艺术家和摄影机构起诉;OpenAI 和微软(连同其子公司技术网站 GitHub)也因创建其 AI 编码助手 Copilot 而被起诉盗版软件。英国纽卡斯尔大学互联网法专家 Lilian Edwards 表示,强烈抗议可能会迫使法律发生变化。

强制诚实使用

一些研究人员表示,因此,为这些工具设定界限可能至关重要。Edwards 建议,现有的关于歧视和偏见的法律(以及计划中的对 AI 的危险使用的监管)将有助于保持 LLM 的使用诚实、透明和公平。「那里有大量的法律,」她说,「这只是应用它或稍微调整它的问题。」

同时,有人推动 LLM 的使用透明公开。学术出版商(包括《Nature》的出版商)表示,科学家应该在研究论文中披露 LLM 的使用情况;老师们表示,他们希望学生也有类似的行为。《Science》杂志走得更远,称不能在论文中使用由 ChatGPT 或任何其他人工智能工具生成的文本。

一个关键的技术问题是人工智能生成的内容是否可以轻易被发现。许多研究人员正致力于此,其中心思想是使用 LLM 本身来发现 AI 创建的文本的输出。

例如,2022 年 12 月,新泽西州普林斯顿大学计算机科学本科生 Edward Tian 发布了 GPTZero。这种 AI 检测工具以两种方式分析文本。一个是「困惑」,衡量 LLMs 对文本的熟悉程度。Tian 的工具使用了一个早期的模型,称为 GPT-2;如果它发现大部分单词和句子都是可预测的,那么文本很可能是人工智能生成的。该工具还检查文本的变化,一种称为「突发性」的度量:与人类编写的文本相比,人工智能生成的文本在语气、节奏和困惑度方面往往更加一致。

许多其他产品同样旨在检测 AI 编写的内容。OpenAI 本身已经发布了 GPT-2 检测器,并在 1 月份发布了另一个检测工具。出于科学家的目的,由反剽窃软件开发商 Turnitin 公司开发的工具可能特别重要,因为 Turnitin 的产品已被世界各地的学校、大学和学术出版商使用。该公司表示,自 GPT-3 于 2020 年发布以来,它一直在开发人工智能检测软件,预计将在今年上半年推出。

然而,这些工具中没有一个声称是万无一失的,尤其是在随后编辑 AI 生成的文本的情况下。此外,德克萨斯大学奥斯汀分校的计算机科学家兼 OpenAI 的客座研究员 Scott Aaronson 说,检测器可能会错误地暗示一些人类编写的文本是人工智能生成的。该公司表示,在测试中,其最新工具在 9% 的情况下将人类编写的文本错误地标记为 AI 编写的,并且仅正确识别了 26% 的 AI 编写的文本。Aaronson 说,例如,在指控一名学生仅仅根据检测器测试隐瞒他们对 AI 的使用之前,可能需要进一步的证据。

另一个想法是人工智能内容将带有自己的水印。2022 年 11 月,Aaronson 宣布他和 OpenAI 正在研究一种为 ChatGPT 输出添加水印的方法。它尚未发布,但由马里兰大学帕克分校的计算机科学家 Tom Goldstein 领导的团队在 1 月 24 日发布的预印本提出了一种制作水印的方法。这个想法是在 LLM 生成输出的特定时刻使用随机数生成器,以创建 LLM 被指示从中选择的合理替代词列表。这会在最终文本中留下一些选定单词的痕迹,这些单词可以通过统计方式识别,但对读者来说并不明显。编辑可能会消除这种痕迹,但戈德斯坦建议编辑必须更改超过一半的单词。

人工智能助手助力科研:GPT-3改变学术界的撰写格局

论文链接:https://arxiv.org/abs/2301.10226

Aaronson 指出,加水印的一个优点是它很少产生误报。如果有水印,则文本可能是用 AI 生成的。不过,它不会是万无一失的,他说:「如果你有足够的决心,肯定有办法击败任何水印方案。」 检测工具和水印只会让欺骗性地使用 AI 变得更加困难——并非不可能。

与此同时,LLM 的创建者正忙于开发基于更大数据集的更复杂的聊天机器人(OpenAI 有望在今年发布 GPT-4)——包括专门针对学术或医学工作的工具。2022 年 12 月下旬,谷歌和 DeepMind 发布了一份关于名为 Med-PaLM 的以临床为重点的 LLMs 的预印本。该工具几乎可以像普通人类医生一样回答一些开放式的医学问题,尽管它仍然有缺点和不可靠。

人工智能助手助力科研:GPT-3改变学术界的撰写格局

论文链接:https://arxiv.org/abs/2212.13138

斯克里普斯研究转化研究所(位于圣地亚哥)所长 Eric Topol 表示,他希望在未来,包括 LLMs 在内的 AI 甚至可以通过交叉检查来自学术界的文本来帮助诊断癌症和了解这种疾病。反对身体扫描图像的文学。但他强调,这一切都需要专家的明智监督。

生成人工智能背后的计算机科学发展如此之快,以至于每个月都会出现创新。研究人员如何选择使用它们将决定他们和我们的未来。「认为在 2023 年初,我们已经看到了这种情况的结束,这太疯狂了。」Topol 说,「真的才刚刚开始。」

来源:ScienceAI

链接:晒科网

人工智能助手助力科研:GPT-3改变学术界的撰写格局

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!