ChatGPT和文心一言:生成式语言模型的应用和挑战
本科论文

ChatGPT和文心一言:生成式语言模型的应用和挑战

在当今人工智能的高速发展中,chatGPT和文心一言等生成式语言模型成为了热门话题。本论文将探讨这些模型的背景、应用、优势以及局限性。 chatGPT是由OpenAI开发的一种基于transformer网络的自然语言处理模型,它能够生成高质量的文本、对话等。它的应用范围广泛,可以用于聊天机器人、智能客服、文本生成等场景。而文心一言则是一种中文生成式语言模型,由深圳市文心信息技术有限公司开发,可用于生成诗歌、对联等文艺作品。 这些模型的优势在于它们能够自动化生成大量的高质量文本,提高了工作效率和文本质量。同时,它们也能够适应不同的语言和语境,为不同场景提供定制化的解决方案。举例来说,chatGPT可以为智能客服提供更加人性化的服务,而文心一言则可以为文学爱好者提供更多样化的文学作品。 但是这些模型也存在着一些局限性。一是它们的生成过程是基于训练集的,如果训练集中存在偏见或错误,那么生成的文本也会存在类似的问题。二是它们不能理解语言的含义和上下文,因此在一些语义复杂的场景下,它们可能会产生不准确的结果。最后,这些模型也存在着数据隐私和安全问题,因为它们需要访问大量的用户数据和知识库。 所以通过上述情况可以看出,chatGPT和文心一言等生成式语言模型是人工智能发展中的重要组成部分,它们在提高文本生成效率和质量方面发挥着重要作用。但是,我们仍然需要认识到它们的局限性,并在使用这些模型的过程中采取相应的措施来减少风险和偏差。 在实际应用中,chatGPT和文心一言等生成式语言模型已经被广泛应用于各种场景中。其中,聊天机器人和智能客服是应用最为广泛的场景之一。 在智能客服应用领域,chatGPT可以为用户提供更加个性化的服务。通过对用户的历史对话记录和个人信息进行分析,chatGPT可以为用户提供更加针对性的建议和解决方案。与传统的客服相比,chatGPT可以更加快速和准确地回答用户的问题,提高了用户的满意度和忠诚度。 在聊天机器人中,chatGPT可以模拟真实人类对话,为用户提供更加自然和流畅的体验。通过对用户的对话进行分析,chatGPT可以逐渐了解用户的兴趣和需求,提供更加个性化的服务。与传统的聊天机器人相比,chatGPT可以更加准确地理解用户的意图和情感,提高了用户的交互体验和参与度。 在文学创作中,文心一言可以为用户提供更多样化的文学作品。通过对不同风格和主题的训练,文心一言可以生成多种类型和风格的诗歌、对联等文艺作品。与传统的文学创作相比,文心一言可以更加快速和高效地生成大量的作品,为文学爱好者提供更多的选择。 除了聊天机器人和文学创作之外,chatGPT和文心一言还可以应用于社交媒体、商业广告、自然语言翻译等场景中。例如,在社交媒体中,chatGPT可以为用户提供更加个性化的内容推荐和广告推广,提高了用户的参与度和转化率。在商业广告中,chatGPT可以为广告主提供更加准确和有效的广告创意和文案,提高了广告的效果和投资回报率。在自然语言翻译中,chatGPT可以为用户提供更加准确和自然的翻译服务,打破了语言和国界的限制。 然而,这些模型也存在着一些局限性和挑战。其中我们上面也说过最重要的是数据隐私和安全问题。由于这些模型需要访问大量的用户数据和知识库,因此存在着数据泄露和滥用的风险。同时,这些模型的生成过程也存在着难以控制和解释的问题,导致可能会生成不合适或有害的内容。 为了应对这些挑战,我们需要采取一系列的措施来加强数据安全和隐私保护。首先,应该加强数据收集和使用的合规性和透明性,确保用户的数据得到充分保护和授权。其次,应该加强模型的可解释性和可控性,确保生成的文本符合道德和法律的要求。最后,应该加强行业和政策的监管和规范,促进模型的健康和可持续发展。 总之,这些模型的不断发展和创新将为人工智能的未来带来更多的机遇和挑战。我们期待看到更多的人工智能技术应用于实际场景中,为人类社会带来更多的福祉和进步。
用ChatGPT薅羊毛,有人月入十几万,有人写27本书赚1.46刀
研博论文

用ChatGPT薅羊毛,有人月入十几万,有人写27本书赚1.46刀

正如人类围棋界已经彻底向AI低头一样,如今,人类世界又多出了一位新的“大师”——ChatGPT。 作为新一代人工智能驱动下的聊天机器人程序,诞生四个月来,它给全世界带来了一场堪称颠覆式的震动。这种震动,终于在上周GPT—4发布时,达到了顶点。它的进化速度令人震惊——一个月之前,它还只能识别文字,现在,它已经进化到可以理解图片内容,就连更复杂和抽象的表达也不在话下。一份来自OpenAI的研究预计,在未来,ChatGPT可能影响80%的工作岗位,并且,“收入越高受影响越大”。 但在这一天到来之前,另一些人想到,不妨利用这个时间差,薅一把ChatGPT的羊毛。某种程度上,知识的价值也与其稀缺性相关,在国内,作为如今只有少数人能接触到的工具,ChatGPT的使用本身就意味着价值。 不信的话,你可以打开任意视频网站,搜索“ChatGPT赚钱”,就可以看到,视频博主们在用不俗的收益与播放量证明,ChatGPT确实能帮你赚钱。在这样的背景下,我们也找到了5个利用ChatGPT,成功薅到羊毛的年轻人,并且,按照他们薅到羊毛的多少进行了排列。当读到文章最后,相信你能从中发现某种真相。 不过,当你发现这些方法的时候,羊或许已经被薅秃了。 文 | 祁佳妮 黎佳佳 编辑 | 易方兴 运营 | 栗子 羊毛厚度:一颗星 “用ChatGPT写26本书,赚了1.46美元” 潘莉莉 50岁 房地产从业者 我住在美国南加州,从二月下旬起,我开始用ChatGPT写书。到现在,我一共写了26本书,其中14本是图画书,12本是文字书。 我写的第一本书是中文侦探小说。写之前,我压根没想过它能写得出来,因为我只给了ChatGPT很少的输入——我说,我要写一个中国版福尔摩斯的故事,要注重细节和外貌描写,对话也要风趣幽默一点,男主得是刘学义的模样,他住在上海的高楼里面给人破案。 当时,脑子里只有这些点子,最后ChatGPT写出来的东西,跟我的期望一比还是有很大落差。我想得很美,以为它能直接生成一本10万字、结构完整的小说,但它其实只能一段话一段话地回答,前后人物也不一致。相当于我要指导它,每一段该写什么,逻辑是什么,还得润色修改文字。后来,我花三天时间,除了吃饭睡觉都在用ChatGPT,才把这部两万七千字的短篇小说写出来。 我专门注册了晋江账号把小说传上去,数据不好,才三百多点击量,也没网友评论。说实话这部小说写得很差,但我还是很兴奋的,这是我第一次用AI工具写一个完整的故事。 这次试水之后,我写书的速度就飞快了。我之后写的全是英文工具书,比如工商管理类的文集,是我专业对口,也不像中文侦探小说那么考验逻辑推理。我会让ChatGPT列一个大纲再开始写作,保证它的前后连贯性。一本纯英文的书,一天可以写两三本。 ▲ 潘莉莉用ChatGPT写的侦探小说(节选)。图 / 受访者提供 我一个人住在美国,偶尔打点一下各处房产,其他时间都很闲,那段时间一门心思扎进去写书,就是觉得很有意思。我脑海里冒出一个点子,ChatGPT几小时就能实现,其实是帮我完成了从0到1这最艰难的一步。 有很多像我一样用ChatGPT写书的人,亚马逊上架了两千多本这样的电子书,我一个人就贡献了26本。自费出版纸质书多划不来,我现在写电子书都没人买。我原先定价0.99美元,还有几个人买,后来想多拿点分成,把价格定到2.99美元,无人问津。截至目前,一共有92人下载了我的书,但都是做活动的时候免费下载的,我真正赚到的钱只有1.46美元。 只能安慰自己,我不靠ChatGPT来挣钱。想要靠它写小说来挣钱是完全不可能的,除非你花几百美元去做市场营销。 我最近写的一本《67个女性形象》,已经是我所有书里下载量最高的,但它在亚马逊免费电子书的排行榜里排九千多位,谁会去看? 我还是别和专业作家抢饭碗了吧。 ▲ 潘莉莉写26本书的总收益。图 / 受访者提供 羊毛厚度:两颗星 “靠ChatGPT薅百家号羊毛,挣了1000元” 张荻 30岁 程序员 我在郑州的央企做程序员,接触ChatGPT比较早,去年12月底就在关注这个工具。 我刷到短视频,有人讲互联网掘金的方式,相比起拍短视频,我觉得用百家号回答问题更容易,正好手头又在用ChatGPT,就尝试了这条路子。 百家号的挣钱模式很简单,有点像百度文库和百度知道,就是针对某个问题做解答,你的答案被选中了,就有稿费。百度在这一点上很实在,如果审核通过,图文答案一条10元,视频答案一条30元。...
文心一言和ChatGPT:人工智能技术在自然语言处理的比较与探讨
研博论文

文心一言和ChatGPT:人工智能技术在自然语言处理的比较与探讨

人工智能技术在近年来的快速发展和应用中,聚焦于深度学习和机器学习两种主要的技术方向,文心一言和ChatGPT则是这两种技术在自然语言处理领域中的两个重要代表。虽然两种技术都可以为自然语言处理领域的应用提供帮助,但其技术原理、应用场景和发展潜力存在差异。下面将分别从技术原理、应用场景和发展潜力三个方面进行比较和探讨。 一、技术原理的比较 文心一言的核心技术是基于深度学习的生成式模型。它使用了长短期记忆网络(LSTM)等技术,在大规模的语料库中训练模型,以生成符合语法、逻辑和语言文化要求的文本。相比之下,ChatGPT则是基于机器学习的预测式模型,使用了Transformer等技术,在大规模语料库上训练模型,以预测和生成下一个单词。由于文心一言的生成式模型具有更强的生成能力,因此在文本生成领域上表现出更高的性能和效果;而ChatGPT的预测式模型则具有更强的语义理解和推理能力,在文本理解和问答系统方面具有更大的应用潜力。 二、应用场景的比较 文心一言主要应用于文本创作领域,如广告文案、新闻摘要、短篇小说等。它可以根据用户输入的关键词或短语,快速生成符合语法和逻辑要求的文本,从而提高文本创作的效率和质量。而ChatGPT则可以用于自然语言理解、问答系统、对话机器人等领域。由于ChatGPT具有更强的语义理解和推理能力,因此在自然语言理解和问答系统等领域表现更为出色。 三、发展潜力的比较 在人工智能技术不断发展的过程中,文心一言和ChatGPT都具有巨大的发展潜力。在技术原理方面,深度学习和机器学习等技术都在不断发展和改进,可以预见,文心一言和ChatGPT都将在技术方面得到不断的提升和完善。在应用场景方面,随着自然语言处理领域的不断扩展和深化,文心一言和ChatGPT在文本生成、自然语言理解、对话机器人等领域都将有更广泛的应用。在发展潜力方面,虽然两种技术都具有非常大的发展潜力,但由于机器学习技术的预测式模型具有更强的泛化能力和推理能力,因此ChatGPT在未来的应用和发展中具有更为广阔的空间和潜力。 四、结论 综上所述,文心一言和ChatGPT都是人工智能技术在自然语言处理领域中的重要代表,两种技术都具有自己的优点和不足,具有广泛的应用场景和发展前景。虽然两种技术在技术原理和应用场景上存在差异,但在人工智能技术快速发展的过程中,两种技术也有可能进行融合和互补。我们期待,未来文心一言和ChatGPT将继续在自然语言处理领域中发挥重要的作用,并为人们带来更为智能化和便捷的语言交互体验。
捋清ChatGPT的来龙与去脉 | 新刊和线下活动
期刊论文

捋清ChatGPT的来龙与去脉 | 新刊和线下活动

《第一财经》杂志最新一期4月刊封面专题,聚焦ChatGPT。自去年年底OpenAI发布ChatGPT,目之所及,主流媒体、自媒体及社交媒体群落对这一产品的讨论可谓“铺天盖地”。随之而来的还有蜂拥而至的投资人、创业者,以及每个普通人对人工智能的好奇或担忧。△点击上图,或点击文章顶部图片,购买本期杂志。人类对AI技术的探索已经走过了许多年,这波爆炸性的热度为什么是现在?为什么是ChatGPT?不妨再简单回顾一下。首先是一个叫作“人工智能生成内容”(AIGC)的概念开始得到认可。它区别于之前的用户生产内容(UGC),也不同于更早期的专业机构生产内容(PGC)。这意味着两件事。首先意味着内容生产主体的切换:具备生产能力和掌握发布权力的主体,正在从个人,转移到善用AI辅助创作的“超级个体”——甚至可以是独立工作的AI本身。同时,AI能施展魔法的疆域正在跨越一个分界点:从“判别式领域”迈入“生成式领域”。过去,AI被认为只能做好判别性的工作。比如,判断一张图片中 的人脸是不是特定的某人,一封来自未知地址的邮件是否为垃圾邮件,或者在一辆自动驾驶汽车前面晃动的到底是需要避开的真人还是无须在意的树影。至于为什么是ChatGPT。2022年面世的两个文生图产品改变了人们对AI的能力偏见。一个是DALL·E 2,另一个是Stable Diffusion。两个产品的图片生成水平第一次让业界看到商用可能。此前,业界最优秀的图像生成工具是生成对抗网络(Generative Adversarial Network,GAN),只能生成特定图片— 比如人脸,换成小狗就不行,得重新训练——DALL·E 2和Stable Diffusion没有这种局限性。 不过,尽管这这两款产品都已突破了一些技术瓶颈,但它们关于AI新时代的开启充其量只是报幕员,ChatGPT才是主角,因为只有它解决了语言问题——起码看起来如此。语言问题的解决意味着新的交互革命。当人们可以用自然语言与机器交流,而机器不仅听得懂这些自然语言,还能与人对话、按照人的话语行事——回答人的问题、画一幅画或者创作一个视频、生成一款游戏——这时候,每个人的电脑、手机上还需不需要安装那么多应用软件就值得重新考虑。也许,只留一个ChatGPT就够了。以上是一些粗略的概括,关于ChatGPT的重要性,你可以在本期《第一财经》杂志的封面专题文章里看到更细致的介绍。不过,特殊性之外,我们会先后退一步,带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。在技术对产业的影响方面,几篇封面专题文章会带你看硅谷巨头在AI技术领域的权力更迭,中国头部技术公司对AI大模型领域的探索,生成式AI的具体应用场景,以及对职场人的影响等。综述——AI新纪元此刻,相信你对无论 ChatGPT还是更大范畴的AIGC到底意味着什么已有足够感知,可能也听过不少业界的溢美之词,比如英伟达创始人黄仁勋称现在为“AI的iPhone时刻”,比尔·盖茨认为AI革命的重要性不亚于互联网的诞生,微软CEO纳德拉则表示这种技术扩散堪比工业革命。我们打算就此打住,不再过多陈述包括ChatGPT在内的生成式AI可能掀起的产业革命——随后的几篇文章会继续从不同视角讨论它。这里,我们后退一步。本文带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。△购买新刊即可读到本文。硅谷——微软 vs Google:AI技术的王权更迭回首过去十余年硅谷围绕人工智能的最前沿探索,在一众伟大科学家的背后,微软和Google的身影始终交织在一起,上演着一轮又一轮技术王权的更迭。本文带你细致回顾近十五年来两家科技巨头在AI技术领域做了哪些事。△购买新刊即可读到本文。本土——中国公司的追赶之旅如同当年苹果用iPod教训索尼,再用智能手机改写IBM、微软和诺基亚的命运一样,OpenAI的故事看起来似乎是颠覆式创新的典型范式,但它在中国留下的故事版本和在硅谷书写的并不那么相同:在硅谷,技术巨头们都是参赛者;在中国,大厂们只是追赶者。本文为你介绍国内的头部技术公司,对AI大模型的探索走到了哪一步。 △购买新刊即可读到本文。 应用 ——生成式AI,都能干点啥? 在创新工场董事长兼CEO李开复看来,以决策式AI为代表的AI 1.0在落地阶段遇到了很大的“瓶颈”,部分是因为它每次的应用和优化都是割裂的,是“孤岛中的AI应用”,人脸识别、智能辅助驾驶、精准广告推送等不同应用间彼此并不能形成有效的“平台”。而AI 2.0时代最大的颠覆,就在于基础大模型提供的“平台”作用。“AI 1.0就像是发明电,AI 2.0就是电网。”宣布将投身于生成式AI创业大军的李开复这么比喻。理论上,大部分行业都能找到其应用场景。本文会为你介绍文本、图像、音频三个领域对于AI技术的应用。△购买新刊即可读到本文。 职场 ——生成式AI会抢走你的饭碗吗? 自从2022年11月30日ChatGPT发布以来,许多人对生成式AI所带来的冲击感到焦虑,担心自己的工作被取代。与人类相比,生成式AI可以更高效地处理和分析大量数据,能更快速准确地回答复杂问题,同时,具备很强的自学能力。从传媒到游戏,从教育到咨询,从广告到建筑,从金融到法 律……生成式AI似乎正在重塑职场。然而,随着人类对生成式AI的了解越深,探索越积极,大家渐渐发现,生成式AI离替代人类的工作仍然有很大一段距离。不过,当越来越多基于AI的工具摆在你面前时,如何更好地利用生成式AI提升工作效率,在未来一段时间内是多数职场人不得不思考的议题。△购买新刊即可读到本文。除了以上封面专题,在本期杂志中你还可以看到:跨境电商——Temu急于“破圈”今年2月12日,拼多多旗下的海外电商平台Temu广告片登上“美国春晚”超级碗,让它成为美国各大社交网络上的焦点话题。Temu投放了两条30秒的广告片,单条的广告投放费用大约700万美元,这轮投放的总成 本接近1亿元人民币。这条昂贵的广告片展现的是一个年轻女孩在Temu的App页面不断点击“添加到购物车”的按钮,以此不停地给自己以及街头的路人换装,背景歌曲则唱出她的心声:“I feel so rich, I feel like a billionaire. ”(我感觉我很富有,我觉得我像个亿万富翁。) 拼多多针对中国本土投放的TVC广告片,一向喜欢这种“洗脑神曲”。这回,Temu超 级 碗广告的后半段,也同样反复循环着Temu的广 告语:“I’m shopping like a billionaire.”(我正在像富豪一样购物)。单就这条广告片而言,Temu收获到的市场反应偏向负面。但从传播的角度,这种洗脑广告的传播效果可能正是Temu需要的。靠高额的投放和会员拉新的刺激补贴政策,Temu已经稳稳把持住美国购物类手机应用下载量第一的位置。现在,“用时最短”的冷启动期过后,Temu需要面对订单洪峰、完善服务体验、改善与卖家的合作关系等等挑战。△购买新刊即可读到本文。报告——防控措施放开后首个季度, 我们的城市“恢复”得怎样?虽然有种种利好,但出口疲弱、经济承压等因素或多或 少阻碍了一些领域的复苏进程。△购买新刊即可读到本文。未来预想图——VTuber:虚拟偶像2.0以运营偶像女团SNH48闻名的 “美踏控股”,如今正在计划推出一个虚拟偶像团体。与以往的真人养成不同,这次他们要为虚拟偶像招募更多的“中之人”。10年前,初代虚拟偶像初音未来或者洛天依们可以通过软件演唱歌曲,以投影形象站上舞台,但现在,运营公司们希望虚拟偶像不仅可以唱跳,还可以成为一个“表演更多元”的艺人。所以“中之人”出现了:他们在幕后为虚拟形象提供动作捕捉,他们要么有唱跳技能,要么可以配音,或者有综艺类的控场能力,甚至可以在一起搭档讲段子。他们不用露脸,他们是可被代替的隐藏人。人们为这种由虚拟形象和一个或多个中之人共同组成的新一代“虚拟艺人”,起了一个名字——VTuber。本文会带你回顾VTuber的发展历程,并为你介绍运营公司选拔中之人的逻辑。△购买新刊即可读到本文。...
捋清ChatGPT的来龙与去脉|新刊和线下活动
期刊论文

捋清ChatGPT的来龙与去脉|新刊和线下活动

《第一财经》杂志最新一期4月刊封面专题,聚焦ChatGPT。 自去年年底OpenAI发布ChatGPT,目之所及,主流媒体、自媒体及社交媒体群落对这一产品的讨论可谓“铺天盖地”。随之而来的还有蜂拥而至的投资人、创业者,以及每个普通人对人工智能的好奇或担忧。 人类对AI技术的探索已经走过了许多年,这波爆炸性的热度为什么是现在?为什么是ChatGPT?不妨再简单回顾一下。 首先是一个叫作“人工智能生成内容”(AIGC)的概念开始得到认可。它区别于之前的用户生产内容(UGC),也不同于更早期的专业机构生产内容(PGC)。这意味着两件事。 首先意味着内容生产主体的切换:具备生产能力和掌握发布权力的主体,正在从个人,转移到善用AI辅助创作的“超级个体”——甚至可以是独立工作的AI本身。 同时,AI能施展魔法的疆域正在跨越一个分界点:从“判别式领域”迈入“生成式领域”。过去,AI被认为只能做好判别性的工作。比如,判断一张图片中 的人脸是不是特定的某人,一封来自未知地址的邮件是否为垃圾邮件,或者在一辆自动驾驶汽车前面晃动的到底是需要避开的真人还是无须在意的树影。 至于为什么是ChatGPT。 2022年面世的两个文生图产品改变了人们对AI的能力偏见。一个是DALL·E 2,另一个是Stable Diffusion。两个产品的图片生成水平第一次让业界看到商用可能。此前,业界最优秀的图像生成工具是生成对抗网络(Generative Adversarial Network,GAN),只能生成特定图片— 比如人脸,换成小狗就不行,得重新训练——DALL·E 2和Stable Diffusion没有这种局限性。 不过,尽管这这两款产品都已突破了一些技术瓶颈,但它们关于AI新时代的开启充其量只是报幕员,ChatGPT才是主角,因为只有它解决了语言问题——起码看起来如此。 语言问题的解决意味着新的交互革命。当人们可以用自然语言与机器交流,而机器不仅听得懂这些自然语言,还能与人对话、按照人的话语行事——回答人的问题、画一幅画或者创作一个视频、生成一款游戏——这时候,每个人的电脑、手机上还需不需要安装那么多应用软件就值得重新考虑。也许,只留一个ChatGPT就够了。 以上是一些粗略的概括,关于ChatGPT的重要性,你可以在本期《第一财经》杂志的封面专题文章里看到更细致的介绍。不过,特殊性之外,我们会先后退一步,带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。 在技术对产业的影响方面,几篇封面专题文章会带你看硅谷巨头在AI技术领域的权力更迭,中国头部技术公司对AI大模型领域的探索,生成式AI的具体应用场景,以及对职场人的影响等。 综述 ——AI新纪元 此刻,相信你对无论 ChatGPT还是更大范畴的AIGC到底意味着什么已有足够感知,可能也听过不少业界的溢美之词,比如英伟达创始人黄仁勋称现在为“AI的iPhone时刻”,比尔·盖茨认为AI革命的重要性不亚于互联网的诞生,微软CEO纳德拉则表示这种技术扩散堪比工业革命。 我们打算就此打住,不再过多陈述包括ChatGPT在内的生成式AI可能掀起的产业革命——随后的几篇文章会继续从不同视角讨论它。 这里,我们后退一步。本文带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。 硅谷 ——微软 vs Google:AI技术的王权更迭 回首过去十余年硅谷围绕人工智能的最前沿探索,在一众伟大科学家的背后,微软和Google的身影始终交织在一起,上演着一轮又一轮技术王权的更迭。 本文带你细致回顾近十五年来两家科技巨头在AI技术领域做了哪些事。 本土 ——中国公司的追赶之旅 如同当年苹果用iPod教训索尼,再用智能手机改写IBM、微软和诺基亚的命运一样,OpenAI的故事看起来似乎是颠覆式创新的典型范式,但它在中国留下的故事版本和在硅谷书写的并不那么相同:在硅谷,技术巨头们都是参赛者;在中国,大厂们只是追赶者。 本文为你介绍国内的头部技术公司,对AI大模型的探索走到了哪一步。 应用 ——生成式AI,都能干点啥? 在创新工场董事长兼CEO李开复看来,以决策式AI为代表的AI 1.0在落地阶段遇到了很大的“瓶颈”,部分是因为它每次的应用和优化都是割裂的,是“孤岛中的AI应用”,人脸识别、智能辅助驾驶、精准广告推送等不同应用间彼此并不能形成有效的“平台”。 而AI 2.0时代最大的颠覆,就在于基础大模型提供的“平台”作用。“AI 1.0就像是发明电,AI 2.0就是电网。”宣布将投身于生成式AI创业大军的李开复这么比喻。 理论上,大部分行业都能找到其应用场景。本文会为你介绍文本、图像、音频三个领域对于AI技术的应用。 职场...
用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出
本科论文

用ChatGPT写论文靠谱吗?有学者试了一下:漏洞百出

编辑:LRS 【新智元导读】虽然ChatGPT写的论文错误太多,但掠夺性期刊应该会接收。(错误尝试!!) ChatGPT以其强大的文本创作能力,直接问鼎地表最强问答模型。 但强大的AI也会带来一些负面影响,比如在问答社区一本正经地写出错误答案,帮助学生写论文等。 最近arXiv上的一篇论文引发了业界的关注,来自西班牙圣地亚哥-德孔波斯特拉大学的研究人员在文中以「人工智能在药物发现中的挑战、机遇和策略」,这篇论文的特别之处在于作者使用ChatGPT辅助论文写作。 论文链接:https://arxiv.org/abs/2212.08104 作者团队在摘要中的最后一段「来自人类作者的说明」(Note from human-authors)中表示,创建这篇论文是为了测试 ChatGPT (一个基于 GPT-3.5语言模型的聊天机器人)的写作能力是否能帮助人类作者撰写评论文章。 作者设计了一段指令作为文本生成的初始提示,然后对自动生成的内容进行评估。再进行彻底的审查之后,人类作者实际上重写了手稿,努力在原始proposal和科学标准之间保持平衡,文章的最后也讨论了使用人工智能实现这一目标的优势与局限性。 但是还有一个问题,作者列表里怎么没有ChatGPT?(手动狗头) 论文写作方法 本文是在ChatGPT的辅助下生成的,ChatGPT是2022年11月30日发布的一个自然语言处理系统,由OpenAI用大量文本语料库进行训练,能够根据提供给它的输入生成类似人类写作的文本。 就本文而言,人类作者提供的输入包括论文的主题(人工智能在药物发现中的应用)、需要考虑的章节数量,以及每个章节的具体提示和说明。 ChatGPT生成的文本需要经过人工编辑后才能作为最终的定稿,以纠正和丰富内容,避免重复和不一致等问题;并且人类也需要对人工智能建议的所有参考文献进行了修改。 这项工作的最终版本是人类作者在人工智能的协助下进行反复修改的结果,直接从ChatGPT获得的初步文本与当前版本手稿之间的总相似度为:完全相同的4.3%,微小的变化13.3%,相关的意义16.3%。直接从ChatGPT获得的初步文本中,正确的参考文献比例仅为6%。 由ChatGPT生成的原始版本,以及用于创建该版本的输入信息都涵盖进来作为Supporting Information 论文摘要中的插图由DALL-E生成。 论文内容 论文总共包括10个section和56个参考文献,其中section1-9都只包含1-2个段落,主要描述论文主题「「人工智能在药物发现中的挑战、机遇和策略」」相关的内容;第十个section主要讨论「人类作者对基于ChatGPT和AI的科学写作工具的专家意见」;文章中只有摘要部分包含一张插图。 摘要 人工智能有可能彻底改变药物发现过程,提供更好的效率、准确性和速度。然而,AI的成功应用取决于高质量数据的可用性、对道德问题的处理以及对基于人工智能方法的局限性的认识。 这篇文章回顾了人工智能在这个领域的好处、挑战和缺点,并提出了克服目前障碍的可能战略和方法。 文章中还讨论了数据增强的使用、可解释的人工智能、人工智能与传统实验方法的整合,以及人工智能在医药研究中的潜在优势。 总的来说,这篇评论强调了人工智能在药物发现中的潜力,并对实现其在该领域的潜力所面临的挑战和机遇进行了深入探讨。 人类作者对基于ChatGPT和AI的科学写作工具的专家意见 ChatGPT是一个基于GPT-3.5语言模型的聊天机器人,它的设计目标并非是撰写科学论文的助手,但它与人类进行连贯的对话并就广泛的主题提供新信息的能力,以及它纠正甚至生成计算代码的能力,都让科学界感到惊讶。 因此,我们决定测试它的潜力,为编写关于人工智能算法在药物发现中的作用的简短评论做出贡献。 作为撰写科学论文的助手,ChatGPT有几个优点,包括快速生成和优化文本的能力,以及帮助用户完成几个任务,包括组织信息,甚至在某些情况下连接思想。 然而,这个工具绝不是生成新内容的理想工具。 输入instructions后,还需要人类对人工智能生成的文本进行修改,而且是大篇幅的编辑和修正,包括替换几乎所有的参考文献,因为ChatGPT提供的参考文献明显不正确。 这也是ChatGPT目前存在的一个大问题,它与其他计算工具(如搜索引擎)相比有一个关键的区别,后者主要是为所需的信息提供可靠的参考。 而采用基于人工智能的工具进行写作辅助还存在另一个重要的问题:它是在2021年训练的,所以它并不包括最新信息。 这次写作实验提供的结果就是:我们可以说ChatGPT不是一个有用的工具,在没有强大的人类干预的情况下无法编写可靠的科学文本。 ChatGPT缺乏准确和充分传达复杂科学概念和信息所需的知识和专长。 此外,ChatGPT使用的语言和风格可能不适合学术写作,为了生成高质量的科学文本,人类的输入和审查是必不可少的。 这种人工智能还不能用于生产科学文章的主要原因之一是它缺乏评估处理信息真实性和可靠性的能力,因此,由ChatGPT生成的科学文本肯定包含错误或误导性信息。 同样需要注意的是,审稿人可能会发现区分由人类或这个人工智能写的文章并非易事。 这使得审查过程必须彻底,以防止虚假或误导性信息的发表。 一个真正的风险是,掠夺性期刊(predatory journals)可能利用科学文章的快速生产来产生大量的低质量内容,这些期刊往往受利益驱使,而不是致力于科学进步,它们可能利用人工智能快速生产文章,让不合格的研究充斥市场,破坏科学界的公信力。 最大的危险之一是科学文章中虚假信息的潜在扩散,这可能导致科学事业本身的贬值,失去对科学研究的准确性和完整性的信任,会对科学的进步产生不利影响。...
ChatGPT能否用来写论文?功能很强大,局限性也很明显!
本科论文

ChatGPT能否用来写论文?功能很强大,局限性也很明显!

本文源自公众号:AI畅游元宇宙,已经授权,欢迎关注。 国外调查显示,学生利用ChatGPT完成作业已经成为了一种社会风气,甚至有许多学生利用它来撰写学术论文。用ChatGPT出来的作品,就连老师和大学教授都难辨别其真伪。 那么,使用ChatGPT来写论文这主意到底靠谱吗?细数写论文时ChatGPT能起到的十大作用。 一、提供论文写作技巧: ChatGPT可以向大学生介绍一些论文写作的基本技巧和策略。这些技巧包括如何组织论文、如何撰写引言和结论、如何使用文献、如何避免抄袭等等。 二、提供主题方向: ChatGPT可以向大学生提供有关论文主题和方向的建议。为他们提供相关的文献和信息,以便他们更好地了解自己的研究领域。 三、检查语法和拼写错误: ChatGPT有办法帮助大学生检查论文中的语法和拼写错误。这可以帮助确保他们的论文看起来更加专业和精确。 四、提供反馈和建议: ChatGPT可以向大学生提供有关他们的论文的反馈和建议。ChatGPT可以指出论文中存在的问题,并提供改进的建议,以帮助学生更好地完成他们的论文。 五、帮助梳理思路: 有时写作过程中会存在思路不清、逻辑不严谨等问题,ChatGPT可以为大学生提供思路梳理和逻辑检查方面的帮助,使得论文更具说服力。 六、解答学术问题: 在论文写作过程中,学生们可能会遇到各种学术问题,例如如何理解某个理论、如何运用某个方法等等。ChatGPT完全可以回答这些问题,为学生提供解决方案。 七、提供文献检索技巧: 在写论文时,合理地利用各种文献资源是非常重要的,可以向大学生介绍文献检索的技巧和方法,帮助他们更好地找到所需的文献资源,以便他们更好地支持自己的论点和观点。 八、帮助格式化论文: 在写论文时,合适的格式化是必不可少的。可以为大学生提供格式化方面的帮助,例如如何设置页边距、字体和行距、如何排版参考文献等等。 九、提供各学科领域知识: 如果大学生需要在特定的学科领域撰写论文,ChatGPT可以提供相关的知识和建议,以帮助他们更好地了解和学握该领域的知识 十、降低抄袭风险: 抄袭是学术界中的一个严重问题。ChatGPT可以帮助大学生避免抄袭。ChatGPT可以提供有关如何正确引用文献、如何避免与他人的论文相似等方面的建议,以降低论文的抄袭风险。 无论是技巧、主题、语法还是其他各个方面,ChatGPT都可以为论文提供多样的建议和支持,帮助大学生撰写出高质量的学术论文。 虽然ChatGPT可以为大学生写论文提供各种各样的帮助和作用,然而并不是没有任何局限性。 第一,ChatGPT 缺乏人类思维上的创造性。例如,在论文的主题和观点方面,ChatGPT只能依据输入的信息提供建议,但不能像人类一样自由创造,这可能会限制学生在论文中表达自己独特的观点。 第二,ChatGPT无法替代自主思考。在撰写学术论文时,必须仔细思考和理解所研究领域的知识,并结合实际情况进行独立思考和判断。如果学生过于依赖ChatGPT,可能会导致他们对研究领域的深入理解和独立思考能力不足,最终影响论文的质量。 第三,ChatGPT不具备人际交流能力。在论文写作过程中,与导师或同学的沟通和交流是非常重要的。ChatGPT缺乏人际交流能力,无法与学生进行深入交流和沟通,也无法提供反馈和建议,这可能会限制学生的论文写作能力。 归根结底,ChatGPT只是一种辅助工具,写论文时确实能够给学生提供相关的思路与建议,但创作的主体必须时学生本身。 学生需意识到,在论文写作过程中,仍需要进行自主思考和独立研究,并且需要与导师和同学进行充分的交流和沟通,恰到好处的使用ChatGPT,以保证学术论文的最终质量。
风头仍劲的ChatGPT,真的会引领未来技术走向吗?
本科论文

风头仍劲的ChatGPT,真的会引领未来技术走向吗?

人工智能正在把我们带入一个新纪元,从很多维度看都是如此。 首先是一个叫作“人工智能生成内容”(Artificial Intelligence Generated Content,AIGC)的概念开始得到认可。它区别于之前的用户生产内容(User Generated Content,UGC),也不同于更早期的专业机构生产内容(Professionally Generated Content,PGC)。这个历程既表明了内容生产主体的切换,意味着具备生产能力和掌握发布权力的主体,正在从象征着“内容民主化”的个人,转移到善用AI辅助创作的“超级个体”——甚至可以是独立工作的AI本身;同时,它也意味着,AI能施展魔法的疆域正在跨越一个分界点:从“判别式领域”迈入“生成式领域”。 过去,AI被认为只能做好判别性的工作。比如,判断一张图片中的人脸是不是特定的某人,一封来自未知地址的邮件是否为垃圾邮件,一篇分享到社交网络中的文章是否带有负面情绪,或者在一辆自动驾驶汽车前面晃动的到底是需要避开的真人还是无须在意的树影。 2022年面世的两个文生图产品改变了人们对AI的能力偏见。一个是DALL·E 2,发布者是后来因推出ChatGPT闻名的硅谷初创公司OpenAI。另一个是Stable Diffusion,出自位于伦敦、同样是初创公司的Stability AI之手。两个产品的图片生成水平第一次让业界看到商用可能。此前,业界最优秀的图像生成工具是生成对抗网络(Generative Adversarial Network,GAN),只能生成特定图片——比如人脸,换成小狗就不行,得重新训练——DALL·E 2和Stable Diffusion没有这种局限性。 上一个让业界看到商用可能并大获成功的AI技术是图像识别。2015年,基于深度学习的计算机视觉算法在ImageNet数据库里的识别准确率首次超过人类。此后,人脸识别系统迅速取代数字密码,成为最新潮的身份标识;可识别商品的自助结算系统也很快进入各类线下门店;连追求安全至上的自动驾驶都用上了AI的视觉判断。 Stable Diffusion和DALL·E 2的商业前景毋庸置疑,但它们关于AI新时代的开启充其量只是报幕员,ChatGPT才是主角,因为只有它解决了语言问题——起码看起来如此。 语言问题的解决意味着新的交互革命,这是AI新纪元的另一个涵义。 科幻作家特德·姜(Ted Chiang)体验ChatGPT后,将其背后的AI模型(GPT)比作互联网的“有损压缩”,意思是,当它学习了所有网上文字的统计规律后,就相当于获得了一个互联网信息的压缩版本——信息有所损失,但没那么多,重要的是,我们需要保存的文件更小了。假使外星人袭来,互联网毁灭,只要GPT还在,理论上我们能通过询问它获得原本存储在互联网上的所有东西。 事实上,不用幻想外星人入侵,特德·姜想象的这一天可能在不久之后就会到来。当人们可以用自然语言与机器交流,而机器不仅听得懂这些自然语言,还能与人对话、按照人的话语行事——回答人的问题、画一幅画或者创作一个视频、生成一款游戏,根据反馈意见再次修改,直到提出需求的人满意为止——这时候,每个人的电脑、手机上还需不需要安装那么多应用软件就值得重新考虑。也许,只留一个ChatGPT就够了。 此刻,相信你对无论ChatGPT还是更大范畴的AIGC到底意味着什么已有足够感知,可能也听过不少业界的溢美之词,比如英伟达创始人黄仁勋称现在为“AI的iPhone时刻”,比尔·盖茨认为AI革命的重要性不亚于互联网的诞生,微软CEO纳德拉则表示这种技术扩散堪比工业革命。 我们打算就此打住,不再过多陈述包括ChatGPT在内的生成式AI可能掀起的产业革命——本期杂志的其余几篇文章会继续从不同视角讨论它。这里,我们后退一步,走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。 01 Transformer的力量 ChatGPT发布之后,OpenAI团队成员接受采访,说公众的热情程度让他们意外,因为“ChatGPT背后的大部分技术并不新鲜”。这一说法属实,外界与之类似的总结是:ChatGPT是一种新时代的“炼金术”,把一个语言统计模型和基于人类反馈的强化学习放在一起,然后就是用可以拿到的语料、估计可行的人工神经网络层数放在一起“炼丹”。 但相较于2018年以前的AI模型,ChatGPT背后的GPT至少有一样东西是新的,那就是看待语言问题的视角。 人下一个会说出口的词,往往是统计学上下一个最可能出现的词——这个理念在语言学界早已有之,但将这种想法开发成对话语言模型是第一次。在此之前,几乎所有号称使用自然语言与人对话的机器人,从百度小度到微软小冰,从亚马逊Alexa到苹果Siri,甚至拿到日本公民身份的Sophia,本质上都是基于搜索树的查询系统。而自然语言处理(Natural language processing,NLP)领域也被工程化地划分为文本分类、机器翻译、阅读理解、文章分级等数十种任务,每种任务都对应一种或几种算法模型。 这些看似不同的问题背后其实是同一个问题。比如,如果一个对话机器人“足够聪明”,聪明到可以在电影评论中预测下一个单词,那么它一定能完成一个简单的正负分类任务,成为一个电影分类器——区分动画片、爱情或者科幻电影——接管之前判别式AI所做的工作。 通关密码就是2017年Google Brain团队写在论文里的Transformer(转换器),GPT的历代模型都基于这一算法架构。工作时,它会计算每个词与之前输入和生成的其他词之间的依赖关系(通常被称作“自注意机制”)。在最新发布的版本GPT-4中,模型能够注意到的单词量多达24576个。 Transformer认为,语言的内部数据之间长跨度地相互依赖,Transformer所做的工作,就是将既有文字的“内部依赖关系”转换到未来的文字中去,也就是“生成”。 信息内部的基本要素之间相互依赖,且具有预测功能——这种看待语言的视角之后也被用到了图片上。2021年,Google Brain团队再次推出一个叫“视觉转换器”(Vision Transformer,ViT)的模型,通过计算同一图像中像素与像素之间的依赖关系来识别图像。 在此之前,语言和视觉被视为不同的东西。语言是线性的、序列的,视觉则是一种有空间结构的、并行的数据。但Transformer证明,图片也可以当成序列问题来解决,一张图片就是由像素起承转合地构成的句子。 不仅图片,大部分问题都可以转化为序列问题。不要小看这种思维的转变。2018年,DeepMind发布的AlphaFold具有预测蛋白质结构的能力,靠的就是对氨基酸序列的学习,其背后架构也是Transformer。 02 语言的价值...