AI时代下的文学挑战:青年诗人戴潍坊的观察与思考
本科论文

AI时代下的文学挑战:青年诗人戴潍坊的观察与思考

第六届成都国际诗歌周在四川成都举行,国内外诗人们围绕“终极关怀:人类的生命与生态”主题进行多种形式的交流与创作。青年诗人戴潍娜,供职于中国科学院,对科技对文学的影响有深刻观察和思考。她认为,世界正在经历电子化折叠,人类的生存空间日益缩小,文学需适应新时代。
用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出
本科论文

用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出

编辑:LRS 【新智元导读】虽然ChatGPT写的论文错误太多,但掠夺性期刊应该会接收。(错误尝试!!) ChatGPT以其强大的文本创作能力,直接问鼎地表最强问答模型。 但强大的AI也会带来一些负面影响,比如在问答社区一本正经地写出错误答案,帮助学生写论文等。 最近arXiv上的一篇论文引发了业界的关注,来自西班牙圣地亚哥-德孔波斯特拉大学的研究人员在文中以「人工智能在药物发现中的挑战、机遇和策略」,这篇论文的特别之处在于作者使用ChatGPT辅助论文写作。 论文链接:https://arxiv.org/abs/2212.08104 作者团队在摘要中的最后一段「来自人类作者的说明」(Note from human-authors)中表示,创建这篇论文是为了测试 ChatGPT (一个基于 GPT-3.5语言模型的聊天机器人)的写作能力是否能帮助人类作者撰写评论文章。 作者设计了一段指令作为文本生成的初始提示,然后对自动生成的内容进行评估。再进行彻底的审查之后,人类作者实际上重写了手稿,努力在原始proposal和科学标准之间保持平衡,文章的最后也讨论了使用人工智能实现这一目标的优势与局限性。 但是还有一个问题,作者列表里怎么没有ChatGPT?(手动狗头) 论文写作方法 本文是在ChatGPT的辅助下生成的,ChatGPT是2022年11月30日发布的一个自然语言处理系统,由OpenAI用大量文本语料库进行训练,能够根据提供给它的输入生成类似人类写作的文本。 就本文而言,人类作者提供的输入包括论文的主题(人工智能在药物发现中的应用)、需要考虑的章节数量,以及每个章节的具体提示和说明。 ChatGPT生成的文本需要经过人工编辑后才能作为最终的定稿,以纠正和丰富内容,避免重复和不一致等问题;并且人类也需要对人工智能建议的所有参考文献进行了修改。 这项工作的最终版本是人类作者在人工智能的协助下进行反复修改的结果,直接从ChatGPT获得的初步文本与当前版本手稿之间的总相似度为:完全相同的4.3%,微小的变化13.3%,相关的意义16.3%。直接从ChatGPT获得的初步文本中,正确的参考文献比例仅为6%。 由ChatGPT生成的原始版本,以及用于创建该版本的输入信息都涵盖进来作为Supporting Information 论文摘要中的插图由DALL-E生成。 论文内容 论文总共包括10个section和56个参考文献,其中section1-9都只包含1-2个段落,主要描述论文主题「「人工智能在药物发现中的挑战、机遇和策略」」相关的内容;第十个section主要讨论「人类作者对基于ChatGPT和AI的科学写作工具的专家意见」;文章中只有摘要部分包含一张插图。 摘要 人工智能有可能彻底改变药物发现过程,提供更好的效率、准确性和速度。然而,AI的成功应用取决于高质量数据的可用性、对道德问题的处理以及对基于人工智能方法的局限性的认识。 这篇文章回顾了人工智能在这个领域的好处、挑战和缺点,并提出了克服目前障碍的可能战略和方法。 文章中还讨论了数据增强的使用、可解释的人工智能、人工智能与传统实验方法的整合,以及人工智能在医药研究中的潜在优势。 总的来说,这篇评论强调了人工智能在药物发现中的潜力,并对实现其在该领域的潜力所面临的挑战和机遇进行了深入探讨。 人类作者对基于ChatGPT和AI的科学写作工具的专家意见 ChatGPT是一个基于GPT-3.5语言模型的聊天机器人,它的设计目标并非是撰写科学论文的助手,但它与人类进行连贯的对话并就广泛的主题提供新信息的能力,以及它纠正甚至生成计算代码的能力,都让科学界感到惊讶。 因此,我们决定测试它的潜力,为编写关于人工智能算法在药物发现中的作用的简短评论做出贡献。 作为撰写科学论文的助手,ChatGPT有几个优点,包括快速生成和优化文本的能力,以及帮助用户完成几个任务,包括组织信息,甚至在某些情况下连接思想。 然而,这个工具绝不是生成新内容的理想工具。 输入instructions后,还需要人类对人工智能生成的文本进行修改,而且是大篇幅的编辑和修正,包括替换几乎所有的参考文献,因为ChatGPT提供的参考文献明显不正确。 这也是ChatGPT目前存在的一个大问题,它与其他计算工具(如搜索引擎)相比有一个关键的区别,后者主要是为所需的信息提供可靠的参考。 而采用基于人工智能的工具进行写作辅助还存在另一个重要的问题:它是在2021年训练的,所以它并不包括最新信息。 这次写作实验提供的结果就是:我们可以说ChatGPT不是一个有用的工具,在没有强大的人类干预的情况下无法编写可靠的科学文本。 ChatGPT缺乏准确和充分传达复杂科学概念和信息所需的知识和专长。 此外,ChatGPT使用的语言和风格可能不适合学术写作,为了生成高质量的科学文本,人类的输入和审查是必不可少的。 这种人工智能还不能用于生产科学文章的主要原因之一是它缺乏评估处理信息真实性和可靠性的能力,因此,由ChatGPT生成的科学文本肯定包含错误或误导性信息。 同样需要注意的是,审稿人可能会发现区分由人类或这个人工智能写的文章并非易事。 这使得审查过程必须彻底,以防止虚假或误导性信息的发表。 一个真正的风险是,掠夺性期刊(predatory journals)可能利用科学文章的快速生产来产生大量的低质量内容,这些期刊往往受利益驱使,而不是致力于科学进步,它们可能利用人工智能快速生产文章,让不合格的研究充斥市场,破坏科学界的公信力。 最大的危险之一是科学文章中虚假信息的潜在扩散,这可能导致科学事业本身的贬值,失去对科学研究的准确性和完整性的信任,会对科学的进步产生不利影响。...
ChatGPT:人工智能对文献情报工作的新启示
期刊论文

ChatGPT:人工智能对文献情报工作的新启示

以下文章来源于中国科讯 ,作者中国科讯 编者按: 人工智能(AI)项目ChatGPT(生成型预训练转换模型)仅用了不到2个月的时间已经成为一种文化轰动。这个基于书面提示自动创建文本的程序异常受欢迎,也对科学界和学术界产生着重大影响。 本期智库观点分享《ChatGPT对文献情报工作的影响(简版)》。本报告由中科院文献情报中心张智雄等撰写,得到国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”和国家社会科学基金重大项目“大数据驱动的科技文献语义评价体系研究”的支持。本文为报告简版。 1、ChatGPT是什么? ChatGPT(Chat Generative Pre-training Transformer,生成型预训练转换程序)发布于2022年11月30日,是由OpenAI公司研发的人工智能对话系统。由于其能在诸多知识领域中给出清晰、详尽的答案,甚至写出接近真人撰写的文章,自推出后便迅速获得关注。 ChatGPT是什么,可以从以下五个方面来把握。 (1)ChatGPT的对外表现是一个聊天机器人。它能够通过学习和理解人类语言来与人进行对话,具有依据对话的上下文环境来回答问题的能力,就像人一样来与人类进行聊天交流。 (2)ChatGPT的实际本质是人工智能生成技术。它是人工智能内容生成(Artificial Intelligence Generate Content,AIGC)技术的具体应用。它在学习人类语言和相关领域知识的基础之上,具有了智能化的内容创作能力,能够自动生成特定的内容。 (3)ChatGPT的关键基础是生成式大规模语言模型。即基于生成式预训练的变换器(Generative Pre-trained Transformer,GPT),它以生成式的自监督学习为基础,从TB级训练数据中学习隐含的语言规律和模式,训练出的千亿级别参数量的大规模语言模型。 (4)ChatGPT的核心技术是InstructGPT。它采用了基于人类反馈的强化学习(Reinforcement Learning with Human Feedback,RLHF),让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。 (5)ChatGPT的主要特点是与前期类似产品相比,编造事实大幅下降,生成的毒内容更少。它在一定程度上解决了传统语言模型在复杂多领域的知识利用、演绎推理、欺骗性反应等方面的缺陷,使回答更具有用性和真实性,具有编造事实大幅下降,生成的模仿性谎言(imitative falsehoods)、毒内容(toxic output)更少的重要特征。 ChatGPT的核心技术体系如图1所示。 图1 ChatGPT的核心技术体系 2、人工智能技术迅速发展给文献情报工作的启示 以ChatGPT为代表的人工智能技术近年取得飞速突破,相关成果广泛应用于各个领域,对社会各行业都产生了巨大冲击。 总结近十余年来人工智能的主要发展历程,我们认为人工智能取得突飞猛进的根本原因在于计算机学习知识、开发利用知识的模式已经改变。能够从各类数据资源(语料)中快速高效地学习到隐藏于这些数据资源中的知识是AI 飞速突破的本质所在。 以ChatGPT为代表的AI技术的迅速发展源于知识学习能力的大幅提升。它带给文献情报机构提升知识学习有以下启示: (1)计算机解决问题模式已改变,机器学习成为获取解决问题所需知识的重要手段。机器学习改变了计算机解决问题的模式。原来是人输入知识让机器解决问题;而现在,是让机器从相关语料中学习知识,再让机器利用学习到的知识去解决相关的问题。在这一过程中,隐藏着重要人类知识的大样本训练语料至关重要。这些以语料为表征的人类知识才是机器学习取得飞速突破的关键。 (2)深度学习的性能提升,除模型突破之外,更要归功于语料和算力。各类深度学习模型是基础,大量可计算数据资源(训练语料)是前提,大规模计算能力是催化剂。拥有大样本训练语料和大规模计算能力,使得基于人工神经网络深度学习的知识学习性能大幅提升。 (3)自然语言处理的技术已经重写,无监督的预训练对于知识学习有重要价值。基于预训练(Pre-Training)和微调(Fine-Tuning)的两阶段学习方法,改写了自然语言处理(NLP)方式,无监督的预训练具有重要价值。利用大规模非标注语料的无监督的预训练,能够使模型从语料中学习到语言表达模式、文字前后逻辑、知识元间关系等知识内容,提高了模型的泛化能力和鲁棒性。在此基础上只用少量标注语料进行微调,即可在特定下游任务中取得较好的效果。 (4)ChatGPT并不是无来由的横空出世,而是学习能力从量变到质变的重大突破。回顾历史来看,从最初的1.17亿参数、5GB语料、12层Transformer的GPT-1模型,到目前的1750亿参数、45TB语料、96层Transformer、采用人类反馈强化学习的ChatGPT模型。ChatGPT是语料、模型、算法,通过迭代训练不断积累而成的。人工智能知识学习能力上,每一个小小的进步都是有价值的,久久为功,不断进步,最终实现了从量变到质变的转换。 (5)ChatGPT是集成创新的成果,学习能力的提升得益于软件、硬件、技术、语料的有效集成。为了适应模型参数量的激增,OpenAI收集、标注了更多的原始训练语料;为了实现更贴近人类的对话效果,研发了基于人类反馈的强化学习方法;为了加速模型训练,部署了28万个CPU 内核、1万个GPU 的超级计算机。通过软件、硬件、技术、语料有效的集成,才使得ChatGPT的知识学习能力获得质的飞跃,造就了当前ChatGPT出色的表现。 3、ChatGPT对文献情报工作的影响 (1)改变文献情报数据组织方式,从表面信息组织到语义内容组织。科技文献情报原始的组织方式往往以题目、摘要、关键词、机构、期刊等表面信息组织为主,较少深入到文献内容中。随着AI技术发展,从科技文献中精确挖掘细粒度知识对象的能力得到提升,以科技文献中研究问题、研究方法、实验步骤、数据资料等深入到文献内容的语义内容组织成为可能。 (2)改变文献情报知识服务的模式,从信息检索到知识问答。目前,文献情报知识获取服务主要基于文献元数据,通过元数据索引实现对海量科技文献数据的检索与获取。ChatGPT等技术可以在语义层面理解论文内容,识别结构化细粒度知识元,形成大规模知识网络。ChatGPT推动了从索引式信息检索方式向问答式知识应答方式的转变。在未来,或许能够实现一种新型的知识问答服务,即用户向智能知识服务平台提问后,平台能够直接生成该问题的答案,并给出答案的相关证据链。 (3)改变文献情报分析方法,从手工作坊到大规模智能分析。文献情报分析过程包括数据准备、统计分析、观点提炼以及报告撰写等一系列复杂工作,往往由人类手工完成。类ChatGPT人工智能技术已具有观点提炼、内容综述、场景问答、语言翻译、语义分析、智能推荐、辅助决策的潜在能力,可以为情报分析人员提供智能化工具,辅助文献情报分析工作。...
当 ChatGPT「杀入」学术出版界,期刊编辑如何辨别「AI痕迹」?学术界该如何对待 ChatGPT?
期刊论文

当 ChatGPT「杀入」学术出版界,期刊编辑如何辨别「AI痕迹」?学术界该如何对待 ChatGPT?

当前对于工程或者基础科学等学科来说,我认为期刊编辑完全不必过于担心ChatGPT产生的影响。 比如我在之前的一个回答里面,提到了我的学生写的Introduction的第一段 Renewable energy penetration has significantly increased during the last decades and will continue to increase in the future. Due to the variability and intermittency of renewable energy, it cannot be precisely dispatched like traditional units. In practice, predicted information about renewable generation is often...
梦晨:官方悄然关闭AI检测器,引发网友争议
期刊论文

梦晨:官方悄然关闭AI检测器,引发网友争议

这篇文章主要讨论了人们对梦晨的官方检测工具的态度。虽然有人对其准确性表示不满,但也有很多人支持关闭AI检测器。文章指出,现有的检测方法存在漏洞,难以真正识别出AI生成的内容。一些网友和心理学家也提出了未来可能出现的新的评估方式。
AI孙燕姿:谷歌I/O大会上的“AI盛宴”
本科论文

AI孙燕姿:谷歌I/O大会上的“AI盛宴”

新一期Hunt Good周报来啦!Google I/O大会的人工智能应用引发热议,ChatGPT等AI工具工作效率颇高,大学生对AI工具的使用越来越熟练。此外,Bard战胜了ChatGPT,成为表达式人工智能的代表。全面开放的Bard、AI搜索、办公助手Duet AI等新鲜工具也受到关注。
人工智能驱动下商业模式创新与企业社会责任的探索
论文选题

人工智能驱动下商业模式创新与企业社会责任的探索

这篇文章主要探讨了人工智能在不同领域的应用研究,包括公司治理、教育、文博信息化、商业模式创新、音乐教育、艺术设计、生物医学工程等。研究发现,人工智能能够有效地解决各种实际问题,如财务危机治理、企业信用风险管理、在线教育发展策略、企业信息化管理、市场精准营销等。同时,人工智能也能推动商业模式的创新,提高企业社会责任。此外,人工智能在音乐、舞蹈、艺术设计等领域也有着重要的应用价值。最后,文章还从心理学的角度分析了人工智能在教育、创作、表演等方面的影响,揭示了人工智能与各领域的紧密联系和巨大潜力。
AI大语言模型助力知识掌握与多语翻译,商汤科技上海AI实验室携手香港中文大学等发布「书生·浦语」
研博论文

AI大语言模型助力知识掌握与多语翻译,商汤科技上海AI实验室携手香港中文大学等发布「书生·浦语」

上海 AI 实验室与商汤科技联合发布「书生·浦语」大语言模型,具有 1040 亿参数,在多项测试任务表现出优秀成绩,并在中文考试中超越 ChatGPT。苹果收购 AR 头显初创公司 Mira。百度智能云发布文心千帆大模型(无锡)创新中心。抖音正在搭建和扩张旗下的自营电商业务矩阵。携程集团公布 2023 年第一季度财务业绩,净营收同比增长 124%。《黑镜》主创承认曾试用 ChatGPT 编写剧本,但效果不理想。Reddit 宣布将裁员 90 人,约占员工总数 5%。Apple Vision Pro 开发套件已开放申请。