ChatGPT:人工智能对文献情报工作的新启示
期刊论文

ChatGPT:人工智能对文献情报工作的新启示

以下文章来源于中国科讯 ,作者中国科讯 编者按: 人工智能(AI)项目ChatGPT(生成型预训练转换模型)仅用了不到2个月的时间已经成为一种文化轰动。这个基于书面提示自动创建文本的程序异常受欢迎,也对科学界和学术界产生着重大影响。 本期智库观点分享《ChatGPT对文献情报工作的影响(简版)》。本报告由中科院文献情报中心张智雄等撰写,得到国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”和国家社会科学基金重大项目“大数据驱动的科技文献语义评价体系研究”的支持。本文为报告简版。 1、ChatGPT是什么? ChatGPT(Chat Generative Pre-training Transformer,生成型预训练转换程序)发布于2022年11月30日,是由OpenAI公司研发的人工智能对话系统。由于其能在诸多知识领域中给出清晰、详尽的答案,甚至写出接近真人撰写的文章,自推出后便迅速获得关注。 ChatGPT是什么,可以从以下五个方面来把握。 (1)ChatGPT的对外表现是一个聊天机器人。它能够通过学习和理解人类语言来与人进行对话,具有依据对话的上下文环境来回答问题的能力,就像人一样来与人类进行聊天交流。 (2)ChatGPT的实际本质是人工智能生成技术。它是人工智能内容生成(Artificial Intelligence Generate Content,AIGC)技术的具体应用。它在学习人类语言和相关领域知识的基础之上,具有了智能化的内容创作能力,能够自动生成特定的内容。 (3)ChatGPT的关键基础是生成式大规模语言模型。即基于生成式预训练的变换器(Generative Pre-trained Transformer,GPT),它以生成式的自监督学习为基础,从TB级训练数据中学习隐含的语言规律和模式,训练出的千亿级别参数量的大规模语言模型。 (4)ChatGPT的核心技术是InstructGPT。它采用了基于人类反馈的强化学习(Reinforcement Learning with Human Feedback,RLHF),让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。 (5)ChatGPT的主要特点是与前期类似产品相比,编造事实大幅下降,生成的毒内容更少。它在一定程度上解决了传统语言模型在复杂多领域的知识利用、演绎推理、欺骗性反应等方面的缺陷,使回答更具有用性和真实性,具有编造事实大幅下降,生成的模仿性谎言(imitative falsehoods)、毒内容(toxic output)更少的重要特征。 ChatGPT的核心技术体系如图1所示。 图1 ChatGPT的核心技术体系 2、人工智能技术迅速发展给文献情报工作的启示 以ChatGPT为代表的人工智能技术近年取得飞速突破,相关成果广泛应用于各个领域,对社会各行业都产生了巨大冲击。 总结近十余年来人工智能的主要发展历程,我们认为人工智能取得突飞猛进的根本原因在于计算机学习知识、开发利用知识的模式已经改变。能够从各类数据资源(语料)中快速高效地学习到隐藏于这些数据资源中的知识是AI 飞速突破的本质所在。 以ChatGPT为代表的AI技术的迅速发展源于知识学习能力的大幅提升。它带给文献情报机构提升知识学习有以下启示: (1)计算机解决问题模式已改变,机器学习成为获取解决问题所需知识的重要手段。机器学习改变了计算机解决问题的模式。原来是人输入知识让机器解决问题;而现在,是让机器从相关语料中学习知识,再让机器利用学习到的知识去解决相关的问题。在这一过程中,隐藏着重要人类知识的大样本训练语料至关重要。这些以语料为表征的人类知识才是机器学习取得飞速突破的关键。 (2)深度学习的性能提升,除模型突破之外,更要归功于语料和算力。各类深度学习模型是基础,大量可计算数据资源(训练语料)是前提,大规模计算能力是催化剂。拥有大样本训练语料和大规模计算能力,使得基于人工神经网络深度学习的知识学习性能大幅提升。 (3)自然语言处理的技术已经重写,无监督的预训练对于知识学习有重要价值。基于预训练(Pre-Training)和微调(Fine-Tuning)的两阶段学习方法,改写了自然语言处理(NLP)方式,无监督的预训练具有重要价值。利用大规模非标注语料的无监督的预训练,能够使模型从语料中学习到语言表达模式、文字前后逻辑、知识元间关系等知识内容,提高了模型的泛化能力和鲁棒性。在此基础上只用少量标注语料进行微调,即可在特定下游任务中取得较好的效果。 (4)ChatGPT并不是无来由的横空出世,而是学习能力从量变到质变的重大突破。回顾历史来看,从最初的1.17亿参数、5GB语料、12层Transformer的GPT-1模型,到目前的1750亿参数、45TB语料、96层Transformer、采用人类反馈强化学习的ChatGPT模型。ChatGPT是语料、模型、算法,通过迭代训练不断积累而成的。人工智能知识学习能力上,每一个小小的进步都是有价值的,久久为功,不断进步,最终实现了从量变到质变的转换。 (5)ChatGPT是集成创新的成果,学习能力的提升得益于软件、硬件、技术、语料的有效集成。为了适应模型参数量的激增,OpenAI收集、标注了更多的原始训练语料;为了实现更贴近人类的对话效果,研发了基于人类反馈的强化学习方法;为了加速模型训练,部署了28万个CPU 内核、1万个GPU 的超级计算机。通过软件、硬件、技术、语料有效的集成,才使得ChatGPT的知识学习能力获得质的飞跃,造就了当前ChatGPT出色的表现。 3、ChatGPT对文献情报工作的影响 (1)改变文献情报数据组织方式,从表面信息组织到语义内容组织。科技文献情报原始的组织方式往往以题目、摘要、关键词、机构、期刊等表面信息组织为主,较少深入到文献内容中。随着AI技术发展,从科技文献中精确挖掘细粒度知识对象的能力得到提升,以科技文献中研究问题、研究方法、实验步骤、数据资料等深入到文献内容的语义内容组织成为可能。 (2)改变文献情报知识服务的模式,从信息检索到知识问答。目前,文献情报知识获取服务主要基于文献元数据,通过元数据索引实现对海量科技文献数据的检索与获取。ChatGPT等技术可以在语义层面理解论文内容,识别结构化细粒度知识元,形成大规模知识网络。ChatGPT推动了从索引式信息检索方式向问答式知识应答方式的转变。在未来,或许能够实现一种新型的知识问答服务,即用户向智能知识服务平台提问后,平台能够直接生成该问题的答案,并给出答案的相关证据链。 (3)改变文献情报分析方法,从手工作坊到大规模智能分析。文献情报分析过程包括数据准备、统计分析、观点提炼以及报告撰写等一系列复杂工作,往往由人类手工完成。类ChatGPT人工智能技术已具有观点提炼、内容综述、场景问答、语言翻译、语义分析、智能推荐、辅助决策的潜在能力,可以为情报分析人员提供智能化工具,辅助文献情报分析工作。...
热议!ChatGPT或引发学术混乱?数千种期刊:它不能成为论文作者
期刊论文

热议!ChatGPT或引发学术混乱?数千种期刊:它不能成为论文作者

ChatGPT诞生才两个月,但它给全世界投下的「重磅炸弹」就没停下来过。 日前,中国人民大学首都发展与战略研究院副院长郭英剑也发表了题为“2023,我们不得不面对ChatGPT引发的混乱”的文章,指出了ChatGPT带来的惊喜以及焦虑。 目前,人工智能聊天工具ChatGPT的功能正在被人们充分挖掘,学生是最早开始使用这一工具的群体之一,其引发的一些问题也引起了教育界的关注。在国内,记者调查发现,网购平台上仍然在售卖五花八门的AI工具。 针对这个情况,记者采访了北京、上海、四川等地的重点大学的一线教师,他们正密切关注学生对于ChatGPT的使用情况。 有的老师明确向记者表示,已经发现有学生用ChatGPT撰写论文。某位高校老师甚至直言,估计今年开学后会出现一些ChatGPT所引发的学术乱象问题。 在采访中,上海某高校教授对记者说道,“国内查重软件目前并没有针对AI的查重,学生即便使用了ChatGPT,也没法查到。”那么,高校要如何应对ChatGPT出的这个难题呢? 学生用ChatGPT写论文,“‘杰作’快赶上老师了” 人工智能聊天程序ChatGPT推出仅两个月,学生群体使用这个AI工具写论文的新闻便层出不穷。远在大洋彼岸的美国高校已“如临大敌”,学校和检测机构各出奇招,试图杜绝学生的“AI作弊”。《纽约时报》报道称,在全美范围内,大学教授、系主任和管理人员已经开始对授课进行大修,ChatGPT促使教学和学习发生了潜在的巨大转变。一些教授正在重新设计他们的课程,包括更多的口试、小组工作和手写评估,而不是打字的评估。那么,国内情况如何?记者分别采访了北京、上海等地的部属重点大学的一线教师,了解情况。“确实已经遇到有学生用ChatGPT写论文交作业的事情,”北京某重点大学法学专业教师告诉每经记者,他称这位学生的“杰作”甚至和老师的水平一样了,完全能看出来是AI。“我的学生都是大学生、研究生,我自己也经历过这个阶段,他们论证的深度、总结的维度,包括全面性等方面,如果用了ChatGPT的话,一眼就能看出来,而且他们获取信息的渠道相对来说也比较狭窄。”这位老师补充称。四川某高校经济学系老师也在密切关注学生使用ChatGPT的情况,一名副教授向记者介绍称,他已经注意到一些学生在尝试用ChatGPT,而由于目前正值国内高校寒假期间,大规模用它写论文的学生目前看来还比较少。但他预测,估计今年开学后会出现一些ChatGPT所引发的学术乱象问题。“学校2月下旬开学,我会密切关注此事,开学后和学生交流,并且与写作课老师讨论,”另一位北京高校英语系教授也向每经记者表示。不过,也有一些高校老师对此相对乐观,其中一名上海重点高校社科类教授在接受每经记者采访时提到,虽然学生用这个(ChatGPT)写作业,对教师来说是个麻烦事,但它只能做些简单重复的工作,高层次的做不到。据《华尔街日报》报道,得克萨斯大学教授保罗•冯•希佩尔也发现,ChatGPT可以肤浅地谈论数学,但它不能真正深入地“理解”数学。“它不能纠正错误的数学概念,还经常会引入自己的错误概念,有时还会犯一些基本的电子表格或手动计算器不会犯的莫名其妙的数学错误。”“它像专家一样行事,有时还能令人信服地模仿专家。但它通常是胡扯艺术家,把真相、错误和捏造混在一起,听起来令人信服,除非你自己也有一些专业知识(才能辨别)。”希佩尔说。 防“AI作弊”有啥招? 在美国,据报道,包括乔治华盛顿大学、罗格斯大学和阿巴拉契亚州立大学在内的学校,教授们正在逐步淘汰带回家的开放式作业,这种作业似乎容易受到聊天机器人的影响。取而代之的是,他们更多选择课堂作业、手写论文、小组作业和口试的方法。有的教授甚至计划采取提高对学生的期望以及对评分方式制定更严格标准的方式。例如,一篇文章以后仅仅有论点、引言、支持段落和结论是不够的。由于ChatGPT在论文上的使用,多家知名学术期刊也正在更新编辑规则。据经济时报(ET)报道,《自然》杂志称,在其期刊上发表的论文,ChatGPT等软件不能被视为作者。“这是因为任何作者的归属都意味着对工作的责任,而人工智能工具不能承担这样的责任。”一些美国的大学教授表示,他们计划使用检测软件来根除AI作弊。国外剽窃检测服务机构Turnitin表示,今年将纳入更多识别人工智能(包括ChatGPT)的功能。另外,来自哈佛大学,耶鲁大学,罗德岛大学和其他大学的6000多名教师也注册使用GPTZero(ChatGPT辨认应用),该程序也有望快速检测AI生成的文本。与美国的剽窃检测工具相比,上海某高校教授直言,国内查重软件主要就是知网,知网主要是针对已经正式刊发的查重,而针对AI的查重目前没有,“学生即便使用了ChatGPT,也没法查。”此外他还介绍道,英国高校的学生进校就要签诚信协议书,一旦违反学术诚信,就要面临被开除的风险。但目前国内高校在这一点上还没有,他建议,“教育部应出面制定严格的规章制度,对教师认为有机器写作嫌疑的文章,应当对学生进行面对面的问询。” 更多学术讲座、学术辅导、论文干货、写作技巧 敬请关注“学术进修课堂”公众号 ▼
人工智能写作工具在我国高校的应用与反思
研博论文

人工智能写作工具在我国高校的应用与反思

近日,国内高校出现学生使用ChatGPT写作论文的现象,引发了广泛关注。学术期刊也开始对此类工具的使用作出规定。《暨南学报》和《天津师范大学学报》都要求作者在使用相关工具时需详细解释如何在文章中使用以及论证自身的创作性。同时,一些高校教师在审核过程中并不能很好地识别出由人工智能工具撰写的论文。尽管ChatGPT可以迅速生成论文大纲,但其内容的准确性和深度仍需人工审慎对待。
AI创作引发文学界地震:科幻作家担忧饭碗被抢
本科论文

AI创作引发文学界地震:科幻作家担忧饭碗被抢

国内科幻期刊《科幻世界》拒绝接收AI创作的科幻小说,引起行业关注。 earlier this year, US-based science fiction magazine "Clarkes World" temporarily closed submissions after an influx of AI-generated content. In the highly variable and massive online literature field, there is a sense of anxiety about the arrival of AI. Some of the first generation of AI...
ChatGPT时代:2023年教育何去何从
本科论文

ChatGPT时代:2023年教育何去何从

ChatGPT是全新的人工智能语言模型,诞生于2022年11月30日,尽管目前仍处于试运行阶段,但其影响已经十分显著。专家们对其可能对全球高等教育产生的影响进行了探讨,并指出了学术界对此的焦虑与恐慌。ChatGPT的出现引发了人们对写作技巧的关注,同时也对其在学术界的应用提出了质疑。
AJEAI润色工具:您的学术写作得力助手
论文润色

AJEAI润色工具:您的学术写作得力助手

AJE AI润色工具,一款经济实用、快速准确的英文稿件写作助手,基于大量研究资料训练,为学术研究人员节省时间,提高学术成果研究质量。使用方法简单,只需登录AJE账户,上传稿件并选择英文风格,等待几分钟后即可查看润色后的文稿。AI润色工具能自动润色并保留痕迹,便于作者查看和修改。其使用前后 language level 对比显著,达到可投稿期刊水平,有效助力学术研究及论文修改。无论是硕博士生、教师还是的作者,AJE AI润色工具都是提升论文语言质量的首选。
SCI论文润色的选择:软件翻译与母语化润色的比较
论文润色

SCI论文润色的选择:软件翻译与母语化润色的比较

这篇文章探讨了SCI论文投稿是否需要润色以及如何选择润色方式的问题。文章指出,虽然期刊杂志没有明确要求SCI文章是否经过润色,但润色对于提升论文质量和通过同行评议至关重要。文章建议,润色方式的选择主要取决于语言表达能力和预算时间,并介绍了三种常见的润色方法:软件翻译润色、母语化润色和多人合作润色。总的来说,SCI论文润色并非必须的步骤,作者应根据自身情况判断是否需要寻求外部帮助。