用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出
本科论文

用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出

编辑:LRS 【新智元导读】虽然ChatGPT写的论文错误太多,但掠夺性期刊应该会接收。(错误尝试!!) ChatGPT以其强大的文本创作能力,直接问鼎地表最强问答模型。 但强大的AI也会带来一些负面影响,比如在问答社区一本正经地写出错误答案,帮助学生写论文等。 最近arXiv上的一篇论文引发了业界的关注,来自西班牙圣地亚哥-德孔波斯特拉大学的研究人员在文中以「人工智能在药物发现中的挑战、机遇和策略」,这篇论文的特别之处在于作者使用ChatGPT辅助论文写作。 论文链接:https://arxiv.org/abs/2212.08104 作者团队在摘要中的最后一段「来自人类作者的说明」(Note from human-authors)中表示,创建这篇论文是为了测试 ChatGPT (一个基于 GPT-3.5语言模型的聊天机器人)的写作能力是否能帮助人类作者撰写评论文章。 作者设计了一段指令作为文本生成的初始提示,然后对自动生成的内容进行评估。再进行彻底的审查之后,人类作者实际上重写了手稿,努力在原始proposal和科学标准之间保持平衡,文章的最后也讨论了使用人工智能实现这一目标的优势与局限性。 但是还有一个问题,作者列表里怎么没有ChatGPT?(手动狗头) 论文写作方法 本文是在ChatGPT的辅助下生成的,ChatGPT是2022年11月30日发布的一个自然语言处理系统,由OpenAI用大量文本语料库进行训练,能够根据提供给它的输入生成类似人类写作的文本。 就本文而言,人类作者提供的输入包括论文的主题(人工智能在药物发现中的应用)、需要考虑的章节数量,以及每个章节的具体提示和说明。 ChatGPT生成的文本需要经过人工编辑后才能作为最终的定稿,以纠正和丰富内容,避免重复和不一致等问题;并且人类也需要对人工智能建议的所有参考文献进行了修改。 这项工作的最终版本是人类作者在人工智能的协助下进行反复修改的结果,直接从ChatGPT获得的初步文本与当前版本手稿之间的总相似度为:完全相同的4.3%,微小的变化13.3%,相关的意义16.3%。直接从ChatGPT获得的初步文本中,正确的参考文献比例仅为6%。 由ChatGPT生成的原始版本,以及用于创建该版本的输入信息都涵盖进来作为Supporting Information 论文摘要中的插图由DALL-E生成。 论文内容 论文总共包括10个section和56个参考文献,其中section1-9都只包含1-2个段落,主要描述论文主题「「人工智能在药物发现中的挑战、机遇和策略」」相关的内容;第十个section主要讨论「人类作者对基于ChatGPT和AI的科学写作工具的专家意见」;文章中只有摘要部分包含一张插图。 摘要 人工智能有可能彻底改变药物发现过程,提供更好的效率、准确性和速度。然而,AI的成功应用取决于高质量数据的可用性、对道德问题的处理以及对基于人工智能方法的局限性的认识。 这篇文章回顾了人工智能在这个领域的好处、挑战和缺点,并提出了克服目前障碍的可能战略和方法。 文章中还讨论了数据增强的使用、可解释的人工智能、人工智能与传统实验方法的整合,以及人工智能在医药研究中的潜在优势。 总的来说,这篇评论强调了人工智能在药物发现中的潜力,并对实现其在该领域的潜力所面临的挑战和机遇进行了深入探讨。 人类作者对基于ChatGPT和AI的科学写作工具的专家意见 ChatGPT是一个基于GPT-3.5语言模型的聊天机器人,它的设计目标并非是撰写科学论文的助手,但它与人类进行连贯的对话并就广泛的主题提供新信息的能力,以及它纠正甚至生成计算代码的能力,都让科学界感到惊讶。 因此,我们决定测试它的潜力,为编写关于人工智能算法在药物发现中的作用的简短评论做出贡献。 作为撰写科学论文的助手,ChatGPT有几个优点,包括快速生成和优化文本的能力,以及帮助用户完成几个任务,包括组织信息,甚至在某些情况下连接思想。 然而,这个工具绝不是生成新内容的理想工具。 输入instructions后,还需要人类对人工智能生成的文本进行修改,而且是大篇幅的编辑和修正,包括替换几乎所有的参考文献,因为ChatGPT提供的参考文献明显不正确。 这也是ChatGPT目前存在的一个大问题,它与其他计算工具(如搜索引擎)相比有一个关键的区别,后者主要是为所需的信息提供可靠的参考。 而采用基于人工智能的工具进行写作辅助还存在另一个重要的问题:它是在2021年训练的,所以它并不包括最新信息。 这次写作实验提供的结果就是:我们可以说ChatGPT不是一个有用的工具,在没有强大的人类干预的情况下无法编写可靠的科学文本。 ChatGPT缺乏准确和充分传达复杂科学概念和信息所需的知识和专长。 此外,ChatGPT使用的语言和风格可能不适合学术写作,为了生成高质量的科学文本,人类的输入和审查是必不可少的。 这种人工智能还不能用于生产科学文章的主要原因之一是它缺乏评估处理信息真实性和可靠性的能力,因此,由ChatGPT生成的科学文本肯定包含错误或误导性信息。 同样需要注意的是,审稿人可能会发现区分由人类或这个人工智能写的文章并非易事。 这使得审查过程必须彻底,以防止虚假或误导性信息的发表。 一个真正的风险是,掠夺性期刊(predatory journals)可能利用科学文章的快速生产来产生大量的低质量内容,这些期刊往往受利益驱使,而不是致力于科学进步,它们可能利用人工智能快速生产文章,让不合格的研究充斥市场,破坏科学界的公信力。 最大的危险之一是科学文章中虚假信息的潜在扩散,这可能导致科学事业本身的贬值,失去对科学研究的准确性和完整性的信任,会对科学的进步产生不利影响。...
ChatGPT会让编辑、翻译、设计师们失业吗?
期刊论文

ChatGPT会让编辑、翻译、设计师们失业吗?

一个多月前,ChatGPT 全网刷屏,我们也在第一时间试着把它训练成小红书读书博主,并探讨了它在辅助创作、提高阅读效率方面的巨大潜力。不仅如此,我们还预言AI创作的流行,将会把更多“水文”“注水书”赶出市场。随着GPT 4.0版本发布并全面接入微软Office全家桶,全球打工人不约而同感觉到一阵寒意,从一个多月前的置身事外,到如今面临“饭碗不保”,AI席卷一切的速度比我们想象中更快。编辑可能是最先感受到这一轮冲击波的群体。早在2月份,不少国外杂志的投稿邮箱就已经被AI创作的文章挤爆了,科幻名刊《克拉克世界》在20天的时间里收到了超过500份垃圾投稿,占到投稿总量的38%,即便有检测软件的辅助,杂志编辑依然感觉耗时耗力,难以招架。最终,《克拉克世界》不得不暂停接受投稿。随后,国内科幻杂志《科幻世界》也宣布拒收AI投稿,只是随着AI创作能力的日新月异,过滤AI辅助创作内容的难度也将直线上升。近日,AI图像生成服务 Midjourney创作的一对情侣在全球社交媒体刷屏,升级到第五版之后, Midjourney已经打破了“AI不会画手”的瓶颈,作品几可乱真。很快,就有国内用户通过GPT4 + Midjourney 的强强联合,画出了《三体》的主要角色。我们暂且不去考虑画师、CG美术设计师们未来何去何从,更关注作为内容把关者的编辑,如何应对“道高一尺,魔高一丈”的AI浪潮。近日,美国版权局已经针对AI生成作品出台了新规,规定版权申请者必须披露 AI 的使用情况,否则注册可能会受到影响。通过ChatGPT、Midjourney等平台自动生成的作品,训练数据是基于人类创作的作品,因此不受版权法保护。这样的规定虽然会让创作者松一口气,但问题在于,判定AI作品的重担就落在了内容审核者身上,比如媒体编辑、版权代理人、图书编辑等,他们不仅要练就一双看穿AI套路的火眼金睛,更要承担“看走眼”之后的法律风险,毕竟总不能像《克拉克世界》一样一拒了之。在国内,首当其冲的当属高校导师及学术期刊编辑,因为一些AI创作平台正在成为“论文降重神器”,通过复制粘贴+全文改写,全网搜罗的内容就摇身一变成了“自己的语言”,原来的查重工具就此失效。从此以后,只看内容“原创性”已经很难用来判断文章质量,而是需要花费更多功夫考察其内在逻辑及论证过程。当然,ChatGPT等AI创作工具,带给编辑们的并不只是更多的工作量,更棘手的工作难度,更高的法律风险,也可以反过来把他们从繁重的文字劳动中解放出来,辅助他们进行审稿、改稿、修订译文,创作小红书、短视频等营销文案。过去,Word仅能提供错别字校对等服务,国内一直没有Grammarly这样可以纠正语法错误,调整语气以及给出风格建议的辅助工具。直到最近两年,国内才陆续出现了一批文本校阅、润色工具,不再仅限于检测错别字,而是可以帮助编辑做更多脏活、累活。我用DeepL翻译了Johann Hari 的《Lost Connections》的开头部分,然后让某国内AI创作平台来帮我校阅译文。它不仅可以发现其中明显的语法错误,标点误用,甚至还能检测出“敏感词”。对于语法错误,你可以通过一键改写,来使其更符合中文的表达习惯。当审稿的效率直线提升,编辑或许就不用再沦为无情的“看稿机器”了。虽然ChatGPT的翻译水平相比DeepL并没有质的飞跃,但只要输入润色指令,进行专业领域的调教,便能够产出更为流畅的译文。DeepL+ChatGPT配合使用,虽然无法替代人工翻译,但至少可以用来比对判断译文质量,对于外版书编辑来说不失为一个工作助手。一个多月前,我们曾尝试让ChatGPT为我们创作小红书推书文案,发现它已经掌握了“车轱辘话来回说”这一废话文学的要领。如今,我们在给出了关键词提示的情况下,尝试让文心一言为东野圭吾的新书《白鸟与蝙蝠》写一篇小红书推文,虽然它并未如ChatGPT一样掌握小红书文案的精髓,对书的理解也停留在“望文生义”的水平,但写出的文案已经足以像模像样。即便文心一言相比ChatGPT在语义理解上仍有不小差距,但对于文案创作来说已经可以胜任。今后,编辑只要精准掌握了一本书的核心卖点,各个平台重复性的营销文案工作可以指导AI来完成。当然,封面设计这件事目前还无法交给AI来完成,从ChatGPT和文心一言分别为《白鸟与蝙蝠》创作的封面来看,AI作画仍然停留在字面理解的层面,很难像设计师一样深入考虑书名的深层意涵,整本书的风格基调,进行恰如其分的视觉表达,更不用说字体设计与视觉元素布局了。尽管Midjourney作品的真实程度已经可以媲美照片,但仍然缺少打动人心的情感力量。图书编辑可能是最不用担心被AI抢走工作的一群人,不仅仅是因为他们收入微薄,也不仅因为这是一项看似简单,实则门槛很高的职业,更因为他们是人类创造力的鉴定者与评判者,是抵御AI创作浪潮的最后一道防线。有了ChatGPT等工具的辅助,编辑就可以有更多时间从事更有创造性的工作,也可以和写作者、绘画者们一起创作出AI难以企及的作品。
80%Nature读者都在用ChatGPT,科研方向最多的竟是头脑风暴!
期刊论文

80%Nature读者都在用ChatGPT,科研方向最多的竟是头脑风暴!

编辑:桃子 【新智元导读】近日,Nature对其读者做了一项在线问卷调查,以调研ChatGPT的使用频率。结果显示,80%的受访者称使用过AI聊天机器人。 ChatGPT在学术界的争议一直不断。 究竟该不该使用ChatGPT写论文,创作? 一些高校、出版社已经明确表态禁止,但同样有人支持使用ChatGPT。 亚马逊统计,截至2月中旬,Kindle商店里已经有200多本电子书将ChatGPT列为作者。 有人担心,如果不提高透明度,这项技术可能会让大量低质量的图书涌入市场,导致许多作家失业。 用ChatGPT头脑风暴 近日,Nature便对自家读者开展了一项调查,研究其对生成式AI工具的使用频率。 研究显示,研究人员热衷于尝试使用生成式人工智能工具,如先进的聊天机器人ChatGPT,来帮助他们完成工作。 与此同时,他们也在担心AI可能会出现潜在的错误和虚假信息。 具体怎么讲? Nature通过在线问卷的方式对627名读者进行了调查。 结果显示,约80%的人至少使用过一次ChatGPT或类似的AI工具。 其中,超过1/5的人经常使用此类工具:8%的人每天都在使用,14%的人每周使用几次。 还有大约38%的受访者知道其他研究人员使用这些工具进行研究或教学。 那这些读者使用ChatGPT等AI工具都在做什么? 相当一部分受访者(57%)表示,他们使用ChatGPT或生成式AI工具仅是创意乐趣,与自己的研究无关。 在与科学相关的应用中,27%的受访者表示用其对研究idea进行头脑风暴。 近24%的人表示他们使用生成式AI工具写代码;大约16%的人表示,他们使用这些工具来帮助撰写研究手稿、制作演示文稿或写文献综述。 只有10%的人使用它们来帮助编写资助申请,10%的人用这些应用来生成图片。 问卷中,参与者通过开放式问答分享了他们对生成式人工智能潜力的看法,以及对其使用的担忧。 一些人表示,这些工具将帮助完成枯燥、繁琐或重复的任务,例如处理数字或分析大型数据集、编写和调试代码、文献检索,能够对研究产生有益的重大影响。 意大利教育部教育研究与创新研究所INDIRE的研究员Jessica Niewint-Gori称,这是一个很好的基础工具,因此你可以专注于更高层次的思考,或定制AI创建的内容。 一些人希望,人工智能可以提供一个快速的初始框架,可以编辑成更详细的最终版本,从而加快和简化写作任务。 印度金奈中央皮革研究所的生物学家Dhiliphan Madhav称, 生成式语言模型对于像我这样英语不是第一语言的人来说非常有用。它能够让我比以往任何时候都更流畅、更快地完成写作。这就像在撰写论文时有一位专业的语言编辑在我身边。 不过,人们对这些工具的可靠性以及滥用的可能性感到担忧。 其中就不乏有人担心AI提供的结果可能存在错误或偏见。 德国慕尼黑大学的分子生物学家Sanas Mir-Bashiri称,ChatGPT曾经为我创建了一个完全虚构的文献列表。这些出版物实际上都不存在,我认为这是非常具有误导性的。 还有人担心,这些工具可能被用来作弊,或者产生貌似合理的科学假信息。 人们经常提到人工智能可以被「论文工厂」用来制作虚假的科学出版物,而过度依赖AI完成写作任务可能会阻碍研究人员的创造力并阻碍学习进程。 许多人一致认为,问题的关键在于你是否将AI视为帮助完成工作,而不是完全取代工作的工具。 ChatGPT上岗写稿 同样,近日,一个著名的科幻杂志《克拉克世界》关闭了其投稿窗口。 原因不难猜测,AI投稿太多了。 《克拉克世界》创办于2006年,曾出版了许多著名科幻作家的作品,并多次获得雨果奖。 据统计,自ChatGPT发布后,今年2月份就有500份垃圾邮件如洪水猛兽般涌来。 在1月份的时候仅有100份,去年10月有25篇。可以看出,投稿数量猛增和ChatGPT发布大致相同。 杂志社推测,很多人就是想用AI赚快钱。 在其博客中,列举了一个典型的例子。 原文是来自雷蒙德 ·...
禁用、检查都没用!换个思路,如何让ChatGPT为写作帮忙
本科论文

禁用、检查都没用!换个思路,如何让ChatGPT为写作帮忙

文 | 郭英剑(中国人民大学首都发展与战略研究院副院长) ChatGPT诞生后,对于写作产生了巨大的影响。虽然此前已有很多致力于机器写作的应用程序,但大多限于日常生活交流的写作。相比之下,ChatGPT学术写作造成的影响是前所未有的,甚至可以说是革命性的。 本文所指的“学术写作”,并非专指对某个学术研究项目最终成果的展示与总结,而是在教育,特别是高等教育中以学术提升为目的、专门训练学生写作技能的各种最终成果,包括读书报告、课程论文、学位论文、创意写作等。 3月23日,美国加州社区学院系统的英语讲师安娜·米尔斯在《美国高等教育纪事》上发表《ChatGPT 变得更好了,这对我们布置的写作作业意味着什么?》一文,探讨了人工智能(AI)之于写作的改变、意义与价值。作为从事了17年写作教学的导师,米尔斯于去年8月开始在ChatGPT的开发与试验过程中参与对其新版本的测试,因此对ChatGPT的机理与运作方式、发展变化非常了解。 结合这篇文章,以及我个人的使用经验,本文重点探讨教师该如何使用ChatGPT为大学教育中的学术写作服务。 GPT-4的写作能力更加强大 3月15日,ChatGPT的母公司OpenAI正式发布了ChatGPT的“升级版本”GPT-4。而当米尔斯将GPT-4相对复杂的响应与其前身GPT-3进行比较时,她深感惊讶和恐惧,因为GPT-4生成的文章更加精确、清晰,也不那么乏味,并且更具实质性地显示了观点之间的联系。 她做了一个真实的事例对比——要求两代ChatGPT对《大西洋月刊》上的同一篇文章作出总结。结果发现,GPT-4的文章内容更加精准,提供了更多信息,观察问题的视角更加多元化。而且,文章摘要在句子结构和单词选择方面具有更大的多样性。 总体上看,GPT-4可以做一些早期版本不擅长的事情,比如合并引语。特别是其语句的语法复杂性有了很大改进,未来的版本也会更好地复制单个作者的语法和错误模式,即如果给它植入某人的写作风格特点(包括出现一些语法错误),它就可以写出一篇带有那个人特点(包括会有一些语法错误)的文章。它可以生成图像的文本分析,也有公司正在研究可以描述视频的人工智能。 米尔斯说,尽管GPT-4越来越复杂,但自己的惊讶和恐惧在约一周后就消失了。 因为它的理解力依旧有限,模型虽好,但输出结果仍经常简单化和公式化,这一点与旧版本相同,且这个版本有时会编造事实和来源,其输出内容也包含一些推理和分析错误。 即便如此,GPT-4显示的强大能力依旧值得关注与重视。正如米尔斯所说,作为大学教师,我们需要慎重考虑GPT-4的新变化对教学方式而言意味着什么。 面对人工智能,人类应放下傲慢 我注意到,面对人工智能,有一种倾向值得关注,即不少人总是试图针对人工智能当下并不擅长的领域进行测试或试探,当人工智能表现出不能、无能乃至出错时,他们便会嘲笑人工智能并以此证明其与人类的差距还很大。事实上,GPT-4的强大已经在告诫我们,人工智能在当下的不能、无能乃至错误,不过是人类还没有给予其足够的数据。否则,它释放出的能量将远远超过人们的期待。 即便在当下,努力搞清楚GPT-4不能做什么也几乎是徒劳且无意义的,更好地了解它并探讨其使用价值才更具现实意义。从这个意义上说,我们应避免两种常见的倾向。 一是阻止学生使用以ChatGPT为代表的人工智能。很多人这样做的原因在于,人工智能非常擅长个人叙述和普通知识的传播,有时能达到以假乱真的地步。但事实上,在技术发达的今天,除非断网或强力屏蔽,否则这种阻止将是徒劳的。 二是期待软件检测生成文本。显而易见的是,人工智能生成的文章和人类书写的文章将会越来越难以区分。因为学生可以将其过去的论文模型输入人工智能程序,并让它以这种风格生成草稿。换言之,ChatGPT在被植入写作特点(包括错误)后,就能写出(故意)带有错误的文章。 要知道,教师往往通过学术语言是否太过流利判定一篇文章是否是ChatGPT所为,但今后无论靠人工还是靠设备,这种方式都将难以见效。现有的OpenAI分类器以及GPTZero等生成文本检测器,已被证明经常将人类书写的文本识别为“可能是 AI”。这种误报可能会导致错误的指控。 站在ChatGPT的肩膀上超越它 如果让学生试着使用ChatGPT,或许人类能站在它的肩膀上并超越它。 首先,教师可以鼓励学生使用人工智能,并将人工智能提供的最简单答案作为学生思考和阐明观点的起点。最起码,利用人工智能可以缩短学生思考问题的过程。比如,ChatGPT构建逻辑论证的能力还不尽如人意,为此,表现批判性思维能力的作业更需要学生自身的努力思考才能完成。 其次,教师应与学生一起探索人工智能的本质和风险。米尔斯提出,教师不能等到自认为是专家时,才在课程中讨论人工智能,而应在课堂上与学生一起了解它。人工智能的能力发展太快,高等教育无法驻足等候。教师完全可以和学生一道探求ChatGPT和其他语言模型可以做什么,以及是否想使用它们或如何使用它们,并帮助学生做好准备。 总之,直面人工智能的现状,并充分认识其危害性,才是人类应该有的态度。 更新ChatGPT语境下的评判标准 在ChatGPT时代,如果人工智能可以取代学术写作,那学生为何还要努力学习这种本领呢? 这牵涉到了我们应如何看待ChatGPT语境下的写作,以及评判标准的问题。事实上,正是因为有了ChatGPT,我们更需要反思过去的写作,并由此进入一个需要重新审视相应评判标准的新时代。 首先,要改变过去的评分原则与评价标准。如果ChatGPT可以产出流畅但乏味的文章,那么语言是否流畅就不应是评价文章好坏的重要指标了。我们应该要求学生展示一种综合能力,并要求他们用独特的视角和智慧回答我们提出的问题,或者展示自己的思想观点。 其次,要强调学生关注写作的动机与价值。我们应更多地让学生了解写作行为本身的重要价值,并强调写作过程的重要性。当下人们看重的往往是已经完成的文本,但我们应该更加强调写作的过程,同时告诉学生,写作练习是大学智性发展的核心所在,将会给他们带来巨大回报,为此要更加鼓励学生主动写作。 最后,要更加重视文章的原创性与独特性。目前,虽然GPT-4已经可以对某些原创的批判性思维结果进行一定的模仿,但尚未产生真正的原创性内容。因此,追求学术文章的原创性与独特性将是未来写作的重中之重。 让学生热爱写作 那么,我们怎样才能让学生真正进入原创性与独特性的写作环境呢?换句话说,什么样的学生才算是具备了原创性与独特性的写作能力呢? 第一,具有辨识能力。应教导学生,在人工智能时代到处是看似权威的胡言乱语。无论是本科生还是研究生,大都处于基础的学术写作阶段,特别容易被ChatGPT生成文本中那些看似雄辩和权威的口才所吸引。因此,教师要帮助学生学习如何发现ChatGPT写得很好、看似有据可查的废话,更要让学生认识到什么样的文章才是真正的好文章。 第二,讲究现实意义。让学生学会思考问题。在引导学生进入既有趣也有意义的写作过程中,试着让他们把主题与现实情况联系起来。让他们看到彼此间只有通过语言与文字进行交流,才能使写作过程更有价值。而且,通过写作,学生可以学习如何厘清思路,找到发声点。 第三,关注写作过程。如果写作源自自觉自愿,那么学生就会主动去写作,而不是求助于文本生成器。教师要对学生写作中的构思、起草、修改和反思进行合理的时间分配和及时的反馈,从而让学生的写作过程充满个性化特征。在这一过程中,“原创性”或许会自然产生。 总之,让学生热爱学习、热爱写作,激发个人的内在动力,这才是防止人们滥用人工智能的最有效方法。 《中国科学报》 (2023-04-04 第3版 大学观察) 举报/反馈
ChatGPT检测器频繁冤枉无辜学生,竟有210万教师在用
本科论文

ChatGPT检测器频繁冤枉无辜学生,竟有210万教师在用

编辑:桃子 【新智元导读】被AI冤枉的你,还好吗? 当你被AI无辜扣上「作弊」的帽子,作何感想? 这件事恰恰发生在了一位高三学生Lucy Goetz身上。原本她写的一篇社会主义原创论文得了最高分。 但是,Turnitin公司的AI写作检测器竟说,Goetz论文结尾是用ChatGPT生成的。 Goetz震惊道,「我很高兴能和老师们保持良好的关系」。 简言之,还好老师了解我,不然跳进黄河都洗不清了。 而更令人惊讶的是,这个ChatGPT检测器现在已经被210万名教师使用。 AI无法打败AI Goetz的论文中被标记出的部分属于异常情况,但这表明检测器有时会出错。 显然,AI是无法打败AI的。这对许多学生来说可能产生灾难性的后果。 为了测试Turnitin的检测器,华盛顿时报的记者Geoffrey A. Fowler对Goetz在内的5名高中生进行了测试。 他们创作了16篇涵盖真实、AI生成,以及混合来源的论文样本。 结果如何呢? Turnitin的检测器至少在一半以上的样本中出现错误,仅是准确识别出了其中6篇,但在3篇上的检测都失败了。其中就包括对Goetz原创论文中8%内容的标记错误。 对于剩下的7篇,Fowler称,「我只会给它部分分数,因为它的判断大致正确,但错误识别了一些ChatGPT生成或混合来源的写作部分。」 然而,Turnitin声称其检测器的整体准确率达到98%。该公司还表示,在其自身测试中,类似Goetz论文的情况(即假阳性)发生的概率不到1%。 Turnitin的AI检测器详细页面会分配一个总分,并突出显示疑似AI生成的句子。该公司表示,它故意用蓝色而非红色标记疑似AI生成的段落,并在得分下方链接教师资源。 加州康科德市Goetz的AP英语课老师Rebecca Dell表示,Turnitin标记AI文本的系统并不总是有效,这令人担忧。 与抄袭指控不同,AI作弊没有源文件作为证据,这最容易让老师对学生带有偏见。 或许并不是每个人都像Goetz那么幸运。 Goetz表示,「对于学生来说,被指控AI作弊尤其令人恐惧。除非你的老师了解你的写作风格,或者对你非常信任,否则没有办法证明你没有作弊」。 AI检测为何如此困难 自ChatGPT面世以来,已经被许多高校的学生和老师用在日常的作业和教学中。 然而,如果不加以限制,ChatGPT将会变成史上最强大的作弊工具,可以帮助学生们写作业,甚至是完成考试论文。 为了反侦察,一款简单易用的检测器成为老师期盼的东西。一位22岁普林斯顿大学的学生Edward Tian,就自行开发了一款检测器——GPTZero。 甚至,OpenAI官宣推出一个新工具,名为AI Text Classifier的文件检测器。 但是,这些检测器的表现并不如人意。 检测出AI创作的内容听起来很简单。但当给你一封手写邮件和ChatGPT生成的邮件后,我们几乎无法辨别。 Turnitin的人工智能副总裁Eric Wang称,用软件检测人工智能写作涉及统计学。从统计学的角度来看,人工智能与人类的区别在于它极其稳定地处于平均水平。 直白点讲,AI水平很稳定。然而,实际上并非这样一个道理。 「像ChatGPT这样的系统就像是自动补全的高级版本,寻找下一个最可能要写的单词。这实际上就是它为什么读起来如此自然的原因。AI写作是人类写作中最可能的子集。」 Turnitin的检测器便会「识别出书写过于一致的平均情况」。挑战就在于,有时候有时人类的写作可能确实看起来处于平均水平。 在经济学、数学和实验室报告中,学生倾向于遵循固定的写作风格,这意味着他们更有可能被误认为是AI写作。 这可能就是为什么Turnitin错误地标记了Goetz的论文,因为它的内容涉及到经济学。 Wang表示,Turnitin努力调整其系统,在标记某个句子为AI生成之前需要更高的置信度,以便在这方面犯错。 并称,自己家的软件已经有了很大的进展。「我首次在1月下旬测试Goetz的论文时,该软件识别出其中大约50%是AI生成的。Turnitin在3月下旬再次通过其系统运行我的样本,那时只标记了Goetz论文中的8%为AI生成的。」 Turnitin的检测器也面临其他重要的技术限制。...
ChatGPT创业,让子弹再飞一会儿
本科论文

ChatGPT创业,让子弹再飞一会儿

深燃(shenrancaijing)原创 整理 | 唐亚华 最近一段时间以来,ChatGPT成了AI乃至互联网领域最大的新风口,它甚至被一些人视为堪比蒸汽机、互联网、手机的颠覆性、革命性的存在。 国内关于ChatGPT的热度也同样持续。百度文心一言率先发布,随后腾讯、阿里也公布正在研发AIGC以及大模型相关技术,华为的“盘古”传言有望对标ChatGPT,前不久360集团创始人周鸿祎也公开演示了其公司的大语言模型。ChatGPT出现之后,中国的互联网科技企业的热情仿佛一夜之间被点燃。 除了巨头公司,不少互联网大佬亲自下场,也为这个赛道添了一把火。美团联合创始人王慧文早已宣布入场,创新工场董事长李开复正在亲自筹组中文版ChatGPT公司,另外阿里贾扬清、搜狗王小川、京东前AI掌门人周伯文都亲自下场,赶赴大模型赛道。 针对ChatGPT乃至整个AIGC(生成式AI)领域的创业投资大热,4月6日,深燃直播间邀请到了英诺天使基金合伙人王晟,氪信科技创始人兼CEO、粤港澳大湾区数字经济研究院计算金融CTO工作室负责人朱明杰博士,就《ChatGPT来了,创业公司的机会在哪里?》这一主题展开了一场深度对话。 以下是直播实录,由深燃编辑整理: 2017年去OpenAI公司参观时,没想到这一天来得这么快 深燃:你是从什么时候开始关注ChatGPT以及整个AIGC行业投资的?怎样提前判定这个领域值得押注? 王晟:我们在上一代AI活跃的十年里已经投了不少优秀的AI项目,有文远知行、推想科技等。 2020年下半年,OpenAI发布了ChatGPT3,这是一个划时代的产品,相比一代、二代有了指数级的跃迁,这就使我们相信未来10-15年是大模型的时代。但是那之后的一段时间里,市场上没有项目可以投,我们一直处在等待中。 深燃:你个人和所在的投资机构重点关注哪些方向?你们在这个领域已经做了哪些布局? 王晟:2022年初,清华大学NLP实验室的孙茂松教授和他的团队出来创业做了语言大模型深言科技,孙老师在国内算是自然语言生成、理解方面泰斗级的人物,我们就出手了。 我们重点关注多模态大模型,例如,我们投的行者AI是聚焦游戏场景,被大家称为游戏行业的“AI四小龙”。 深燃:2017年,你跟真格基金联合创始人王强一起去过OpenAI公司参观考察,你们当时为什么会去这家公司?考察完之后,你的感受是什么? 朱明杰:ChatGPT1.0推出时,我就一直在跟进,我作为从业者一开始反而不太相信它能达到现在的水平,因为难度太大。 去年11月OpenAI发布3.5版本,我试用后太震惊了。联想到2017年我们去参观OpenAI公司时,一群刚毕业的PhD在做汇报,其实每个学计算机的人都能预想到出现今天的状况,但没想到只用了短短的几年,而且是这么一群年轻人实现的。 ChatGPT的出现是新一轮工业革命,是2022年人类世界中最重要的事情。 朱明杰和王强参观OpenAI公司,OpenAI创始人Sam Altman(山姆·奥特曼)正在发言 / 受访者供图 深燃:OpenAI能做出ChatGPT,有什么有利因素? 朱明杰:即便是在美国,ChatGPT的出现也是很偶然的事情,但也有几个必要的因素。OpenAI创始团队具备典型的“天赋与偏执”并存的特质,而且他们是一个很年轻、没有太多包袱的团队,另外还有微软的算力支持、数据与场景支持等因素。 深燃:你们会用哪三个词来形容ChatGPT? 王晟:大力出奇迹、从感知到创造、从知识到逻辑。尤其是它具备了逻辑思维,这是很大的进步。 朱明杰:第一个词我想到的是“弗兰肯斯坦”(Frankenstein)。这是英国作家玛丽·雪莱的一部小说名,这本书也翻译为《人造人的故事》,ChatGPT也是人造人的故事。我们做计算机的人从业之初就是想要做就是这件事,ChatGPT一定程度上实现了这本书里的内容。 另外两个词就是“一本正经”和“胡说八道”。 深燃:目前的ChatGPT有哪些“硬伤”或者风险? 朱明杰:大概是我刚刚提到的“一本正经地胡说八道”,它给的信息如果是误导性的,将会有很大的危害。目前有一些国家因为这个原因在封锁它,但技术是会不断进步的,下一步行业要做的是找到一条合规可控的路径。 具体到我所从事的金融领域,难点在于,如果数据壁垒存在,金融等高敏感领域将无法完全适用,一旦出现问题无法追责。这一问题是永远存在的,通用大模型无法解决这一问题,除非各个细分领域建立专属大模型。 王晟:风险在于,当一个机器具有逻辑思维的时候,它离有情感情绪、自我意识还有多远?这是人类第一次站在造物主的视角去思考自己的未来,我觉得它最可怕的是它产生了情绪或自我意识之后,故意给人错的信息,有可能造成灾难。从业者要考虑的是怎么去做一个有人类价值观的AI。 未来AIGC真正的大场景,可能是我们从来没见过的应用 深燃:现在围绕ChatGPT创业的人很多,作为投资人,据你观察,这些方向大概分哪几类? 王晟:第一,是研发大模型,直接对标ChatGPT,在ChatGPT这类语言大模型之外还可以扩展到图片、视频等领域;第二,是将ChatGPT垂直应用到各个细分领域。 去年底和今年这几个月,尤其是王慧文宣布自带5000万美金下场后,把市场上的团队全都“炸”出来了。现在虽然说是新的大模型和AIGC驱动的时代,但投资的重点方向还是底层基础设施,可是国内有能力做大模型的团队也就十来个。大模型方向的机会,基本是属于巨头公司、少数大厂大牛、科学家、AI领域教授们的。 深燃:有哪些机会适合创业公司? 王晟:在应用场景侧,目前出现的创新项目还比较少。现在的创业场景非常受限于底层的基础设施和想象力。我们刚从移动互联网时代过来,能想到的就是把移动互联网跟AIGC结合,实际上未来AIGC真正的大场景可能是我们从来没见过的应用,就像PC时代没有美团、滴滴、抖音等。现在大家都在说ChatGPT是AI的iPhone时刻,但其实iPhone1是2007年发布的,微信是2011年才出现的,滴滴、拼多多、抖音就更靠后了。 一些真正突破性的应用还需要等基础设施和工具链建设完成,进入到应用场景和商业模式的创新的阶段。如果大家有在应用层做创新类创业的冲动,不如让子弹再飞一会儿。 需要强调的是,以投资人的标准来看,投一个企业是需要它具备成长为百亿人民币估值公司潜力的,以这个为标准,可投的项目不多,但VC不愿意投资,不代表就不是好项目。很多创业创新都对社会、人类有益,而且越来越多的创新发生,真正巨大的创新才会涌现。 比如有一类创业机会是用AIGC解决原有行业问题,把AI当成生产力工具,解决各行业原来的创造问题。比如游戏行业原画师、设计师、插画师不用自己画了,AI能出想法、概念,或者应用ChatGPT去做一些客服、销售工作,节省人力,提高效益。所以大家不要用VC的眼光和标准来要求自己,各行各业现在就可以去毫不犹豫地全面拥抱AI。 英诺天使基金合伙人王晟 深燃:你一般一周要见几个项目,这一波项目里,可投的好项目多吗?有没有看过一些不靠谱的项目? 王晟:对于VC来说,这一波可投的好项目非常少。我见到最多的项目是文生图的生成器,一般都是用Stable...
中国人民大学的在读博士生,提问ChatGPT与虚拟数字人结合的问题
研博论文

中国人民大学的在读博士生,提问ChatGPT与虚拟数字人结合的问题

在读博士生的提问我就不写了,在知网我对博士生的回答:您也好,我不过是选择了科技领域的一个自媒体人,很荣幸能与博士一起探讨人工智能技术的发展和应用,至于美国研发的这款聊天机器人程序,我觉得并不一定有多先进,我国在人工智能技术,语言编程上早就是领跑全球了。比如这个程序还没在网络上相传的时候,我国就有聊天机器人,与陪伴型机器人,所谓的趋势不过是利益驱使,因为虚拟人在近阶段没能满足商家的期待。比如在各个平台的带货情况, 我个人认为即便把聊天机器人程序结合数字虚拟人,也一样不能满足商家的期待,最主要的原因就是它不是真人,代替不了真人与用户之间的沟通情感。如果商家硬是这么做了,那一定是比之前的效果会好一点,或许数字虚拟人会大范围地进军电商行业。也冲击着当下的直播行业,它的出现主要是在网上虚拟世界。数字虚拟人接入机器人聊天程序,在网上会满足一些喜欢聊天的人,可能会让我们觉得不可思议。但也最大限度地让我们了解了机器人聊天程序的厉害。 在技术层面,人工智能无论如何都是要向前发展的,一成不变那就是人工智障。我觉得这个程序就是更加精确的一种人工智能算法,也只有在中国才能发挥它最大的作用和效果,因为算法是需要大量数据的喂养才可以越来越卓越。就好像阿里云一样,有14亿人的数据,才使得阿里云稳稳地成为世界算法第一,除了淘宝之外,12306网站也是阿里云的“练兵场”如果阿里云放在一个人口少的小国家,它也许会没人知道。 在情感方面,我觉得它来得似乎有点早了。由于机器人聊天程序的介入,会在网络上引起一个小风暴,它直接影响了直播行业,但它仍然取代不了直播行业的真人,也影响了自媒体这一小块,如果按照网络上说的它可以写论文,那么我们只需把我们的关键词输入,那么我们的文章是不是就可以自动完成了?而且瞬间就可以转化成了视频,图文,视频都是轻而易举的出现了,那以后是不是机器人聊天程序就可以做自媒体了呢? 资本可以利用程序,完全取代人类。不仅线下被人工智能机器人取代,被无人驾驶取代,被流水线上的机器臂取代,线上也开始了无底线地“进攻”,这是人类最不想看到的事情。数字虚拟人结合聊天程序,是一种进步的表现,这也是人工智能发展的必然趋势,哪能光发展体力,不发展脑力啊!最后我想说凡事都有两面性,虽然它的发展是积极的,在资本的驱动下,也会快速来到我们中间,不过它来早了,因为我们这个社会并没有完全准备好。一句话它太超前了,资本很可能会再次对虚拟人失望。 我们的社会将很快进入下一个时代,我想说虚拟人是应该出现在下一个时代的。经过“科技革命”或产生一个新的时代,那就是我们常说的人工智能时代,云计算时代,大数据时代,区块链时代,5G时代,万物互联时代,总之下一时代一定是智能时代,也可以叫做科技时代,在下一时代虚拟人是必不可少的产物,因为我们每个人都会生活在“两个世界”就是虚拟现实技术所带动的各种场景,线上虚拟世界和线下真实世界。 在数字经济的带动下,我们是离不开虚拟网络世界的,我们所想象的美好都会在下一时代发生,包括数字虚拟人的最大化应用。我们可以定义那是个不久的未来,我之前管未来叫“元宇宙”模式社会。我认为商家就是看到了“元宇宙”里面的“金矿”才不断促进网络发展,想使这个未来社会快速运转起来。但“元宇宙”模式社会的一切驱动力,是所有的基础技术,当所有的基础技术成熟了。那个未来社会也就开始运转了, 而机器人聊天程序,也是未来“元宇宙”模式社会中的基础技术之一,就好比电脑一样软硬件都要齐全了,你才可以接上网络网运行。包括你接入的4G,5G,网络。都属于最基础的技术。未来社会只有在云计算,大数据,区块链,5G,人工智能,等这些技术都成熟的时候,我们的美好时代也就到来了。这么说你能明白吗?虽然这种单一的技术,不能说是“鸡肋”,它只是人工智能技术的一种,或许它可以成为“元宇宙”的敲门砖, 但资本单凭这个是带动不起来一个庞大的未来社会的。中国的未来或者说世界的未来,不是谁都可以去驱动的,那是水到渠成的事。但我们追求美好生活的心还是要积极的,目标可以放远大,万事急不来。不知道我这么回答你可否满意, 以上是我回答一个在校博士生的提问,主要是关于ChatGPT的到来,提出来几点问题,在这里也希望各位老铁,给予正确的指导,我们相互学习,共同进步。中国才能更好,我们的未来大家才会更明白。谢谢评论区让我看到你
ChatGPT:我们为什么要读博士?
研博论文

ChatGPT:我们为什么要读博士?

人为什么要读博士? 读博士有许多原因,以下是一些常见的原因: 深入学术领域:博士研究生阶段是深入学术领域的最高阶段。通过博士学位课程,研究生可以进一步加深对自己所研究领域的了解,积累专业知识和技能,并成为该领域的专家。专业发展:对于许多职业来说,拥有博士学位是晋升和提高薪资的必要条件。博士学位表明了持有者的专业能力和深度,并使他们具有更广泛的职业选择和晋升机会。探索新领域:许多人选择攻读博士学位是为了探索他们感兴趣的新领域。这可以使他们了解不同的学科和方法,从而拓展他们的学术和专业兴趣。增强研究能力:博士学位需要完成一项独立的研究项目,并撰写一篇学术论文。这个过程可以帮助研究生培养自己的研究能力、创新能力和解决问题的能力,从而成为一名独立的研究者。成为一名教育者:许多博士研究生选择成为教育者,他们可以成为高校或大学的教授,培养下一代的专业人才。 总之,攻读博士学位可以帮助人们深入了解自己所研究的领域,培养专业能力,增强研究能力和解决问题的能力,并为未来的职业和学术发展提供广泛的机会。