ChatGPT和文心一言:生成式语言模型的应用和挑战
本科论文

ChatGPT和文心一言:生成式语言模型的应用和挑战

在当今人工智能的高速发展中,chatGPT和文心一言等生成式语言模型成为了热门话题。本论文将探讨这些模型的背景、应用、优势以及局限性。 chatGPT是由OpenAI开发的一种基于transformer网络的自然语言处理模型,它能够生成高质量的文本、对话等。它的应用范围广泛,可以用于聊天机器人、智能客服、文本生成等场景。而文心一言则是一种中文生成式语言模型,由深圳市文心信息技术有限公司开发,可用于生成诗歌、对联等文艺作品。 这些模型的优势在于它们能够自动化生成大量的高质量文本,提高了工作效率和文本质量。同时,它们也能够适应不同的语言和语境,为不同场景提供定制化的解决方案。举例来说,chatGPT可以为智能客服提供更加人性化的服务,而文心一言则可以为文学爱好者提供更多样化的文学作品。 但是这些模型也存在着一些局限性。一是它们的生成过程是基于训练集的,如果训练集中存在偏见或错误,那么生成的文本也会存在类似的问题。二是它们不能理解语言的含义和上下文,因此在一些语义复杂的场景下,它们可能会产生不准确的结果。最后,这些模型也存在着数据隐私和安全问题,因为它们需要访问大量的用户数据和知识库。 所以通过上述情况可以看出,chatGPT和文心一言等生成式语言模型是人工智能发展中的重要组成部分,它们在提高文本生成效率和质量方面发挥着重要作用。但是,我们仍然需要认识到它们的局限性,并在使用这些模型的过程中采取相应的措施来减少风险和偏差。 在实际应用中,chatGPT和文心一言等生成式语言模型已经被广泛应用于各种场景中。其中,聊天机器人和智能客服是应用最为广泛的场景之一。 在智能客服应用领域,chatGPT可以为用户提供更加个性化的服务。通过对用户的历史对话记录和个人信息进行分析,chatGPT可以为用户提供更加针对性的建议和解决方案。与传统的客服相比,chatGPT可以更加快速和准确地回答用户的问题,提高了用户的满意度和忠诚度。 在聊天机器人中,chatGPT可以模拟真实人类对话,为用户提供更加自然和流畅的体验。通过对用户的对话进行分析,chatGPT可以逐渐了解用户的兴趣和需求,提供更加个性化的服务。与传统的聊天机器人相比,chatGPT可以更加准确地理解用户的意图和情感,提高了用户的交互体验和参与度。 在文学创作中,文心一言可以为用户提供更多样化的文学作品。通过对不同风格和主题的训练,文心一言可以生成多种类型和风格的诗歌、对联等文艺作品。与传统的文学创作相比,文心一言可以更加快速和高效地生成大量的作品,为文学爱好者提供更多的选择。 除了聊天机器人和文学创作之外,chatGPT和文心一言还可以应用于社交媒体、商业广告、自然语言翻译等场景中。例如,在社交媒体中,chatGPT可以为用户提供更加个性化的内容推荐和广告推广,提高了用户的参与度和转化率。在商业广告中,chatGPT可以为广告主提供更加准确和有效的广告创意和文案,提高了广告的效果和投资回报率。在自然语言翻译中,chatGPT可以为用户提供更加准确和自然的翻译服务,打破了语言和国界的限制。 然而,这些模型也存在着一些局限性和挑战。其中我们上面也说过最重要的是数据隐私和安全问题。由于这些模型需要访问大量的用户数据和知识库,因此存在着数据泄露和滥用的风险。同时,这些模型的生成过程也存在着难以控制和解释的问题,导致可能会生成不合适或有害的内容。 为了应对这些挑战,我们需要采取一系列的措施来加强数据安全和隐私保护。首先,应该加强数据收集和使用的合规性和透明性,确保用户的数据得到充分保护和授权。其次,应该加强模型的可解释性和可控性,确保生成的文本符合道德和法律的要求。最后,应该加强行业和政策的监管和规范,促进模型的健康和可持续发展。 总之,这些模型的不断发展和创新将为人工智能的未来带来更多的机遇和挑战。我们期待看到更多的人工智能技术应用于实际场景中,为人类社会带来更多的福祉和进步。
文心一言,比ChatGPT晚出生的学霸
本科论文

文心一言,比ChatGPT晚出生的学霸

作者:吴辰光、李汭遥 备受瞩目的国产版ChatGPT终于来了。 3月16日,百度发布新一代大语言模型、生成式AI产品文心一言。从现场展示看,文心一言在某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。 但或许有了谷歌仓促应对ChatGPT在演示时出现重大错误的前车之鉴,此次百度没有做现场演示。又或许是在百度发布会的两天前,OpenAI推出升级版ChatGPT-4,再一次将门槛提高,打乱了百度的节奏。总之,与一个月前的高调预热相比,此次发布低调了许多。 百度创始人、董事长兼首席执行官李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。 但不管怎样,大语言模型是无法突击速成的,百度能成为第一个对标ChatGPT的中国科技企业,终究是向前迈出了一步,而如何缩短与OpenAI的差距,将是下一步的看点。 文心一言如约而至 3月16日,百度召开新闻发布会,围绕新一代大语言模型、生成式AI产品文心一言展开。现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。 在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。 在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。 面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。 中文理解方面,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。 多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力,文心一言甚至能够生成四川话等方言语音,但视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。 李彦宏表示,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。 从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。 CHIP奇谱科技总编罗国昭表示,文心一言不如预期但在预料之内,很多人会拿文心一言和ChatGPT-4相比,觉得无论在语言理解能力还是功能特性上都有较大差距,但这是以静态的方式来看待发展中的事物,其实双方都处于快速成长过程中。 在DCCI互联网研究院院长、知名互联网学者刘兴亮看来,文心一言比预期要好一些。虽然和ChatGPT总体上还有差距,但对于中文的理解更好一些。同时,文心一言抢先一步的生成图片功能也是个亮点。 高调预热低姿态发布 与一个月前的高调预热相比,此次发布低调了许多。 2023年伊始,随着微软对OpenAI追加数十亿美元的投资,让ChatGPT在国内刷屏了。百度、阿里、腾讯、华为等大厂纷纷表示自己在大模型领域已展开布局。此后,包括原美团创始人王慧文在内的多位科技圈大佬也纷纷发文宣布打造中国的OpenAI。其中,百度给出的信息是最详细的。 2月7日,百度通过其官方公众号宣布将推出类ChatGPT产品文心一言,引发热议,百度港股股价盘中一度拉高17%。一周内,已有上百家企业宣布将接入文心一言。李彦宏曾表示,中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。 可见,无论是市场还是百度自己,都对文心一言充满信心。但GPT-4的出现或许打乱了百度的节奏。 3月14日,OpenAI正式发布了GPT-4,这个大型多模态模型可以实现强大的识图能力、字数限制提升至2.5万字、回答准确性显著提高、生成歌词、创意文本,实现风格变化等多项飞跃式提升,在各种专业测试和学术基准上表现与人类水平相当。总之,与GPT-3.5相比,GPT-4的能力大幅提升,就像是小学生跨越升级到高中生。 再回到文心一言的发布现场,李彦宏先是打了一剂预防针:“从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。但也不能说我们完全ready了,文心一言要对标ChatGPT、甚至是对标 GPT-4的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。” 在李彦宏看来,是需求推动了文心一言的面世,百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是客户需要,合作伙伴需要。 刘兴亮认为,ChatGPT-4确实给了百度很大的压力,但什么产品都不可能是完美的,新产品总要拉出来溜溜的。现阶段看,文心一言连续对话能力、逻辑推理能力与ChatGPT-4还是有一定差距的。 罗国昭告诉坤舆商业观察,文心一言的上线多少有仓促的因素,但百度的AI能力不用质疑。ChatGPT只是AI的一种模式,并不是全部,而百度的AI之路也不是从文心一言开始的。AI不仅是语言的理解能力,更依赖于其他多维模式,如图形、视频等。“AIGC好不好看、回答尴尬不尴尬,有相当成分的主观因素。对于技术的脉络,大家并无差距。” 未来仍有机会 一个插曲是,在文心一言发布后,百度股价经历下跌和大幅反弹,这表明市场对文心一言的技术能力、使用体验、商业化前景等维度存在巨大分歧,亦导致公司股价大幅波动。 中信证券认为,作为首次亮相的语言大模型,在模型微调、体验反馈、优化落地等方面仍需强化,同时参考海外经验,语言大模型从预训练完成到实际发布落地,亦需经过1-2个季度的优化与升级。而百度此次亦在生态合作伙伴中进行内部测试,通过测试实现产品的迭代与升级。 自2月份以来,已有超过650家企业宣布接入文心一言生态,未来预计会有更多企业进行申请参与。 中信证券预计,文心一言在短期仍将聚焦迭代升级。随着经济的持续复苏,百度的核心业务有望逐季度改善,并对当前公司估值形成支撑,后续AI模型的升级优化亦将带来估值弹性。维持百度的“买入”评级。 实际上,百度积累的优势不是一朝一夕可以完成。在过去的10年里,百度在AI的研发投入超1000亿元。 李彦宏指出,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,无法速成。 人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层到“芯片-框架-模型-应用”四层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。 李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了 4D 混合并行技术。 在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,这是百度独特的优势。后续,芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,从而升级用户体验。 虽然目前还无法与ChatGPT相提并论,但百度毕竟是目前国内第一个对标ChatGPT的企业,未来一段时间内,在其他国内大厂没有进一步动作的情况下,百度仍肩负着国产ChatGPT的崛起重任。 “整体上要追上ChatGPT,个人觉得挺难的。因为你跑别人也在跑,ChatGPT作为先行者用户量越大数据越多,用户参与打分的行为越大,对于后来者来说,追赶的难度就越大。”刘兴亮说道,“但百度不是没有机会,如果说ChatGPT-4是目前的综合冠军,那百度可以在个别领域去争单项冠军。” 罗国昭认为,相比英文语料已经非常好的结构化,中文语料有着明显的差异。用发展的眼光看,在中文的环境里,本土的百度更具优势。同时,对这种产品来说,个人使用是小打小闹,更多的要看行业应用的可能性,行业应用可以快速导入商业应用。真正的AI能力既是企业的核心竞争力,也是国家的战略竞争力,这个是非常大的一个前景。 “目前OpenAI也处于初步的商业化过程中,百度有机会。ChatGPT-4是个学霸,文心一言则是晚出生一点的学霸。”罗国昭说道。
【高端访谈】嘉实基金孟夏:ChatGPT不断迭代升级,文心一言正式亮相,A股将如何掘金新技术颠覆性变化的投资机会?
研博论文

【高端访谈】嘉实基金孟夏:ChatGPT不断迭代升级,文心一言正式亮相,A股将如何掘金新技术颠覆性变化的投资机会?

本文共3324字 阅读完约6分钟 金融投资报记者 张璐璇 去年11月以来,ChatGPT等新技术的推出,在世界范围内激起前所未有的对人工智能的讨论热潮,资本市场随即演绎了一波行情。 美国时间3月15日凌晨,OpenAI宣布ChatGPT升级为算力更惊人的GPT-4。北京时间3月16日下午,国产版的百度“文心一言”正式面世,这些再度引发社会热议。 随着人工智能技术的不断升级,将对全社会和相关产业带来怎样的深远影响?我国在人工智能方面的技术水平如何?A股在人工智能领域的掘金机会有哪些?带着这些问题,金融投资报记者采访了嘉实基金的基金经理孟夏先生。 孟夏 嘉实优势成长混合、 嘉实领先成长混合基金经理 记者提问能谈谈ChatGPT技术给当今社会带来的进步或颠覆体现在哪些方面? 孟夏:AI从原理上讲,是海量数据打上标签喂给机器,不断训练机器,最终让它给出正确的推理。在传统的编程中我们输入的是数据与规则,也就是给出一个X和关于X的函数,让机器输出一个Y,而AI是给机器很多个X和很多个Y,最终让AI学习出其中的规则。 ChatGPT其实就是微软推出的一款人工智能技术驱动的自然语言处理工具,也是AIGC(AI-Generated Content,人工智能生成内容)技术进展的一个体现,称得上是人工智能技术、算力和数据三项条件日渐成熟的产物,拥有强大的信息整合能力、自然语言处理能力,能根据要求进行聊天、可以生成游戏剧本、编写程序代码,以及进行文学、媒体相关领域的创作,包括创作音乐、诗歌等,它的面世,给相关领域带来了前所未有的惊喜,更长远地看,则是更多的机遇与挑战。 以GPT-3为例,其训练模型数据以及使用规则达到45TB的全互联网文本,具有1750亿个参数,算力相当强大。而最新公布的升级版GPT-4,文本量和参数更是上升到了一个惊人的新高度,它比之前的版本具有更强大的识图能力,文字输入限制提升至2.5万字节,回答准确度显著提高,能够生成歌词、创意文本,还能够实现风格变化等。 记者提问当下,美国微软推出的ChatGPT技术处于世界的领先水平,请问,中国在这个领域的技术如何?中国追赶世界人工智能最前沿技术的条件或优势在哪些方面? 孟夏:今年2月份由ChatGPT支持的最新版本搜索引擎和浏览器升级更新;近日Windows 11再次更新——将新版AI搜索添加到任务栏中。3月15日,OpenAI又正式宣布ChatGPT升级成算力更惊人的GPT-4。毫无疑问,这些都是领先于世界的最新技术。 目前,全球还没有能跟ChatGPT抗衡的大模型,我国虽然多个机构和企业发布了一系列大模型,但相比ChatGPT仍有一定差距。因为ChatGPT需要更高算力的芯片、更高效力的算法、更庞大的数据,我国的差距主要体现在高算力的芯片和高效力的算法两个方面。业界共识是这个差距在两年以上,但我们认为,中国的实际差距可能并没有那么大,预计是在一年左右。 据中国科学技术信息研究所报告,包括算法在内的中国人工智能地位和GDP排名是相符合的,总体约排在第二的位置。另有报告显示,2022年全球半导体专利申请数量达到了创纪录的69190项,其中,我国半导体专利申请量达到了37865项,占全球总量的55%,遥遥领先其它国家。 算力、算法、数据是人工智能的三要素。其中,算力称得上是算法和数据的基础设施,其大小决定了数据处理能力的强弱。因此,算力产业需求广阔,“东数西算”工程正式启动之后,算力逐步赋能千行百业,包括人脸识别、自动辅助驾驶系统、地质勘探、高端制造等。 据测算,算力如果每投入1元,将带动3元-4元的经济产出。2021年,我国算力产业规模达到2.6万亿元,直接和间接分别带动经济总产出2.2万亿元和8.2万亿元。另有统计,我国算力总规模近5年年均增速超过25%。 记者提问近日百度推出“文心一言”,被业界称为中国版的ChatGPT。您认为,这些人工智能技术将给中国社会、经济及百姓的生活,带来哪些可见的变化?或深远影响? 孟夏:我们也关注到,自2月份百度官宣“文心一言”以来,已经有超过650家企业宣布启动接入“文心一言”生态,参与其全面测试、体验与业务深度合作,涉及金融保险证券、媒体、汽车、互联网等行业。 在3月16日下午举行的新闻发布会上,百度方面展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。从现场展示来看,“文心一言”某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。 我们认为,随着人工智能不断赋能经济社会各领域,新技术将日渐成为科技跨越发展、产业优化升级、生产力整体跃升的新动能,这将有助于促进提高全要素生产率,推动经济高质量发展,带来社会巨变的同时,也改变了人们的生产生活方式。 据中国信通院预计,2022年我国人工智能核心产业规模(增加值)达到5080亿元,同比增长18%。相信,未来这一领域的发展空间不可估量。 记者提问一般地,新技术的浪潮都会在资本市场率先得到体现,您如何看待去年底以来的A股这一波ChatGPT相关行情? 孟夏:投资需要往前看,更多是投资未来,此轮A股与ChatGPT相关的行情更多的是基于市场或投资者对其前景看好的预期。整体看,ChatGPT距离大规模应用落地还有一段距离,这个过程更多会充满曲折。 其实,ChatGPT等工具算力再厉害,其实仅是提供了一种模型的框架,具体在各行业要取得专业化的实现应用,还有一段很长的路要走。如果将ChatGPT比作为一个人在高中必须具备的基本社会生存技能的话,他还需要继续在大学、在研究生阶段,去接受了各行业更专业的技术和技能培训,才能真正适应社会方方面面的真实需求。 在参与ChatGPT概念的投资时,投资者还是要保持冷静,正视风险是和机遇并存的。投资者对国内类ChatGPT相关的企业的评判,也要区分真伪和参与程度的高低。 记者提问目前,A股中的公司与ChatGPT或“文心一言”相关的企业关联度紧密吗?在哪些领域的企业会涉及或受益于这些新技术的推广或深化?投资者将如何把握相关投资机会? 孟夏:ChatGPT技术仍处于进化阶段,大规模商业应用还需要不断探索和验证,建议投资者关注因为需求持续释放而受益的算力板块,以及因为数字经济发展受益的数据要素板块。任何新兴事物的崛起过程都不会一帆风顺,尤其是像ChatGPT技术这样高精尖的前沿科技领域,波动性更是在所难免。 对于投资者来说,相关的资金和专业、技术等门槛都较高,因此,建议还是将专业的事交给专业的人来做,可以借道公募基金等专业投研力量来参与分享新技术带来的投资盛宴。 单位及嘉宾简介 嘉实基金 嘉实基金成立于1999年3月,是国内最早成立的十家基金管理公司之一,现已发展成为具有“全牌照”业务的综合性国际化资产管理集团。目前,管理资产总规模超过14500亿元,公司成立以来,累计服务1.18亿个人投资者、8000多个机构投资者,共创造基金回报超过2100亿元。 孟夏 嘉实优势成长混合、嘉实领先成长混合基金经理。CFA,复旦大学金融学学士、硕士。2014年7月加入嘉实基金,2018年任研究部制造组组长,2020年7月22日起任嘉实优势成长基金经理,2022年11月2日起任嘉实领先成长基金经理。 孟夏擅长高端制造、软硬科技、平台型服务业、消费和医疗制造、专精特新等领域投资研究,坚信“长期可持续收益的唯一来源是优秀企业持续成长创造的价值”,希望通过深度研究、持续跟踪,“聚焦顶级的企业,发掘长期的成长”,成为长期业绩优秀的底仓型成长基金经理。 编辑|贺梦璐 本文为|金融投资报jrtzb028(微信号)| 未经授权,禁止转载 如需转载,请联系金妹儿 转载须在正文开头显著位置 注明稿件来源及作者名,违者必究互联网新闻信息服务许可证号:51120180008
ChatGPT能取代多少程序员?
本科论文

ChatGPT能取代多少程序员?

来源:深燃(ID:shenrancaijing) 作者:邹帅 编辑:唐亚华 “去年年底,我看到大佬们都在分享ChatGPT相关的内容,一开始我以为还是资本和大佬fomo的玩具,但是经过使用、和朋友交流,加上自己的研究,我确信ChatGPT模型是革命性的。”樊高曾在国内大厂做过后端工程师,离开程序员岗位许久,他因为ChatGPT又再一次将目光投向代码世界。 樊高觉得,作为生成式AI,ChatGPT的交互能力极强,“它其实是用整个人类在互联网中的语调,训练成了一个大语言集合,可以想象它会开启一个使用自然语言和机器交互的新时代。”而作为曾经的技术人员,樊高也承认,⼤部分初级和重复劳动的工作都会被AI代劳,这在程序员工作中也一样。 “我们日常写代码,最早是一行行的码,每个变量方法都要自己生成,后来idea有代码补全和编译器,现在GitHub Copilot (微软与OpenAI共同推出的AI编程工具) 可以通过描述需求和上下文,智能写代码。”按照这个逻辑,他认为,编码也并不是不可取代的能力,交给AI指日可待。 市场上也有AI取代程序员的消息传出。据CNBC报道,据谷歌内部的测试显示,ChatGPT能够通过谷歌的初级软件工程师面试,这个职位通常适用于新的大学毕业生和第一次从事编码工作的求职者。有计算机从业者也进行了尝试,发现ChatGPT确实能够进行写基础的脚本,虽不能进行完整的编程直接开发一个程序,但它能通过一步步指令,教人类完成这一项工作,它甚至有debug (排错) 的能力。 如此看来,大量基础的编码工作可以由AI完成,而AI通过长时间学习能否无限提升自己的编码能力,也未可知。有程序员向深燃表达了自己的担忧,曾以为搞IT会是比高速收费员稳定的“铁饭碗”,然而现在发现自己也是那个小窗里随时会被取代的人。 没人能在人工智能的洪流前保持傲慢。推动科技的人,都有可能反过来被科技取代。 01 “我几分钟写的代码,ChatGPT只要几秒钟” 谭林是一位前端开发工程师,目前在加拿大工作。去年年底,ChatGPT面世,北美科技圈就已经开始关注并讨论了。她说,同事们试用之后,都从技术角度充分肯定了这款工具的优势,也有人开玩笑说要转行,以后让ChatGPT写代码就行了。 “我试着用ChatGPT写了代码之后,确实感受到了一丝焦虑。”谭林告诉深燃,她给ChatGPT的指令是:写一个JS (JavaScript) 文件,生成一个restart button (重启按钮) ,点击这个button要求刷新页面。ChatGPT很快就给出了一段完整的代码,并在下面解释了自己的思路。“这段如果我写可能需要几分钟,它只要几秒钟。” 谭林尝试的仅仅是一段基础的代码,需求只是在页面添加一个功能。树莓健康APP联合创始人阿晨告诉深燃,他让ChatGPT写了一个小程序,它也能又快又好地完成。“我的需求是开发一个AI识别错别字的软件。我首先问了一下ChatGPT开发思路是什么,从后端用哪个框架去搭建,前端用微信小程序的某某框架去做,再到小程序怎么上架发布,它都能够一一列举出来。”阿晨表示,他此前没有小程序开发经验,这次也是正好让ChatGPT教他做,从提供思路到如何执行,阿晨按照它的指引,成功开发完了这个小程序,并在微信开发平台上架了。 和谭林的感受相似,阿晨也发现,ChatGPT不仅能帮用户解决具体问题,还能有理有据地解释背后的逻辑,既能授人以鱼,又能授人以渔。阿晨举例,他对ChatGPT提出指令“小程序textarea指定位置颜色变红”,ChatGPT给出回答:“要在小程序中的‘textarea’中指定某个位置的文本颜色变浓,可以通过在‘textarea’中插入‘rich-text’标签来实现。在‘rich-text’中使用‘’标签,并为该标签指定‘style’属性来控制文字的颜色、字体大小等样式。”回答这些原理之后,ChatGPT还给出了具体的操作步骤。 阿晨在开发过程中还遇到了几个程序报错,他把报错信息贴入ChatGPT让它检查,它也能准确地debug,“我根据它的回答可以直接解决问题。”阿晨表示,在没有小程序开发经验的情况下,他可能需要查阅资料学习,大概两三天能完成开发,遇到问题也不一定很快地解决。“我们平时会用百度这样的搜索引擎,但因为这类工具给出的答案不是特别准确,我还需要在海量的信息中做二次筛选,所以整体时间会拉长。而放到ChatGPT里面,它从告诉我怎么做,到解决bug成功运行,总共就花了3个小时。” 人类几天才能完成的工作,ChatGPT只要几小时;人类要做几分钟的工作,ChatGPT只要几秒钟。速度和效率的提升,是AI的价值之一,而在程序员的眼中,从分到秒的进化,也几乎是“恐怖”的程度,因为很难想象AI在速度上的上限。 除了速度,ChatGPT的“逻辑”和“思考”能力也超出了一些程序员的预期。谭林在日常工作中会经常寻求ChatGPT的帮助,他觉得比以前用Google效率高得多。 “比如我要写一个软件,这里面包含几十个文件,我把其中一个文件中的一段代码筛下来给ChatGPT,这里边可能会出现很多变量和数据是来自其他文件的,它就会在底下解释的时候,说这部分变量虽然在这段代码里没有出现,但可能是从其他文件中传递过来的。同样的问题如果问Siri这类AI,它们就会说‘我不知道你这个变量从哪来的。’” 接触了ChatGPT一段时间,谭林的心情也经历了几次变化,“最开始听到的时候还是持质疑态度,以为只是类似Siri一样的东西。发现它能跟我一样写代码,并且可以运行的时候,我是很震惊的。这种震惊直接引发了一些职业焦虑,它的速度比我快这么多,那如果它经历长时间的学习和训练,是不是就会有取代我的一天?” 谭林以前学生物,转做程序员理由之一就是觉得这个职业很难像收银、银行柜台、高速收费员一样快速被机器取代,“疫情也让我有一些侥幸心理,因为我们这个工作没有受什么影响,还能居家办公,但直到ChatGPT这种AI的出现,我才反应过来,原来程序员也不是铁饭碗,原来我的职业危机可能会是它带来的。” 02 能部分代工,但不能完全取代程序员 ChatGPT具备基础的代码能力,而且写起来速度更快。不过,如果真的把ChatGPT放在程序员的工作场景中,它还是暴露出了不少局限性。 先说写代码这一基础环节。几位程序员的共同体验是,让ChatGPT写一些基础的脚本,为网页写一个功能,指导完成小程序的开发,从技术角度来说都是可行的。但是,“它只能写代码片段,不能写完整的代码。”阿晨解释,“可以这样理解,比如我想生成一个word文档,但ChatGPT只能生成一个文字形式,我如果需要两个word文档,它还是只能给我一段文字,要生成文档我还需要手动拷贝到office软件进行人工处理,而且ChatGPT是有字数限制的,最多15000个字符。”阿晨认为,只从写代码这个层面来说,不能写一个完整的程序是ChatGPT最大的劣势,因为开发人员是需要有把控整个框架的能力的。 有人曾这样形容程序员工种的不可替代性:“程序员的核心竞争力不在于写代码,而是在于跟各种人扯皮,斗智斗勇。”实际上,在业务场景中,不管是前端还是后端,测试还是运维,程序员工作中最困难和耗费时间的是需求转换,测试、修改。简单来说就是明确公司要什么,然后做出来。这一项需要大量人类经验和创意的工作,ChatGPT目前还很难完成。 阿晨举例,他们做的是健康管理类的APP,里面需要有一些减肥菜谱,这种菜谱之间存在一定逻辑,“如果让ChatGPT帮我实现一个菜谱查询的功能,它不知道这个减肥菜谱是怎么插入数据库、怎么调出来、工作人员怎么通过后台维护,需要我把步骤跟它讲一遍,但这样的步骤等于是我自己已经把代码的框架写完了,它只是帮我实现框架里的内容填充。” 让ChatGPT理解业务,目前来看显然是一个伪命题,所以程序员在日常工作中最耗时耗力的那一部分,很难被取代。不仅是具体的业务难以理解,涉及一些复杂的极端的生产活动,ChatGPT也只能从自己的数据库中归拢总结一些“漂亮的废话”。 樊高说,比如向ChatGPI提问“k8s中的Workload Type有哪些”,这个问题很基础,一般是用于面试程序员的,ChatGPT能非常完整地作答。“但是如果问‘如何做双十一淘宝的下单功能,让它支持54万/gps?’,它只能列举采用分布式架构、采用缓存技术、使用负载均衡、数据库优化、代码优化这几点。”樊高认为,这只是一个模棱两可的,没有给出具体模型理论和实操价值的答案。“而我们现实生活中的一些业务场景,只能使用人脑去探索和解决,这也是程序员的工作。解决这些专业性强,跟随市场变化的问题,人脑甚至都很难给出完美答案,AI暂时更是无法代劳。” “各行各业都有一些拧螺丝的工作,一般都会交给实习生或者刚入门的人员来做。在我们的工作中,比如设立一个技术方案,需要有人去具体地把它实现,但这个crud (数据库的增删改查) 就比较无聊和繁琐。类似这种已经设计好了,只需要执行的工作,以后完全可以交给AI来做。”国内某大厂程序员阿冬认为,这种来自AI的‘侵入’是个好事,“能被AI替代的工作,本来我就不想干了。这些没有创造性的工作由AI接手,正好能让我有精力做更多有意思的事情。” 从事基础工作的“底层程序员”也许会感到一丝凉意,前美的集团AIoT算法负责人连诗路告诉深燃,高阶程序员,也就是“大牛”是很难被取代的。 “拿开发一个ChatGPT来举例。在搭建这个模型的时候,大牛会提出,第一个环节要用supervised deep...
文心一言和ChatGPT:人工智能技术在自然语言处理的比较与探讨
研博论文

文心一言和ChatGPT:人工智能技术在自然语言处理的比较与探讨

人工智能技术在近年来的快速发展和应用中,聚焦于深度学习和机器学习两种主要的技术方向,文心一言和ChatGPT则是这两种技术在自然语言处理领域中的两个重要代表。虽然两种技术都可以为自然语言处理领域的应用提供帮助,但其技术原理、应用场景和发展潜力存在差异。下面将分别从技术原理、应用场景和发展潜力三个方面进行比较和探讨。 一、技术原理的比较 文心一言的核心技术是基于深度学习的生成式模型。它使用了长短期记忆网络(LSTM)等技术,在大规模的语料库中训练模型,以生成符合语法、逻辑和语言文化要求的文本。相比之下,ChatGPT则是基于机器学习的预测式模型,使用了Transformer等技术,在大规模语料库上训练模型,以预测和生成下一个单词。由于文心一言的生成式模型具有更强的生成能力,因此在文本生成领域上表现出更高的性能和效果;而ChatGPT的预测式模型则具有更强的语义理解和推理能力,在文本理解和问答系统方面具有更大的应用潜力。 二、应用场景的比较 文心一言主要应用于文本创作领域,如广告文案、新闻摘要、短篇小说等。它可以根据用户输入的关键词或短语,快速生成符合语法和逻辑要求的文本,从而提高文本创作的效率和质量。而ChatGPT则可以用于自然语言理解、问答系统、对话机器人等领域。由于ChatGPT具有更强的语义理解和推理能力,因此在自然语言理解和问答系统等领域表现更为出色。 三、发展潜力的比较 在人工智能技术不断发展的过程中,文心一言和ChatGPT都具有巨大的发展潜力。在技术原理方面,深度学习和机器学习等技术都在不断发展和改进,可以预见,文心一言和ChatGPT都将在技术方面得到不断的提升和完善。在应用场景方面,随着自然语言处理领域的不断扩展和深化,文心一言和ChatGPT在文本生成、自然语言理解、对话机器人等领域都将有更广泛的应用。在发展潜力方面,虽然两种技术都具有非常大的发展潜力,但由于机器学习技术的预测式模型具有更强的泛化能力和推理能力,因此ChatGPT在未来的应用和发展中具有更为广阔的空间和潜力。 四、结论 综上所述,文心一言和ChatGPT都是人工智能技术在自然语言处理领域中的重要代表,两种技术都具有自己的优点和不足,具有广泛的应用场景和发展前景。虽然两种技术在技术原理和应用场景上存在差异,但在人工智能技术快速发展的过程中,两种技术也有可能进行融合和互补。我们期待,未来文心一言和ChatGPT将继续在自然语言处理领域中发挥重要的作用,并为人们带来更为智能化和便捷的语言交互体验。
文心一言开启邀测,专家呼吁多点耐心,给中国类ChatGPT更多成长机会
研博论文

文心一言开启邀测,专家呼吁多点耐心,给中国类ChatGPT更多成长机会

距离新一代人工智能语言模型GPT-4发布不到24小时,国内互联网大厂百度3月16日发布了对标ChatGPT的AI产品——文心一言。 尽管百度创始人兼董事长李彦宏一上台就“降了音调”,表示推出文心一言是为了回应市场期待,产品本身并不完美,但仍然无法降低网友心中早已被拉满的期望值。 文心一言开启邀请测试不到一小时,就涌入了3万多家企业申请。而从2月7日官宣预告到邀请测试,中间隔了37天。毫无疑问,文心一言的推出为竞争已近白热化的自然语言处理赛道再添一缕硝烟,也意味着ChatGPT全球赛开场。近期,国内还有数款类ChatGPT模型将要发布,面对差距,国内产品应该如何追赶“国际顶流”?专家呼吁国内用户多一些耐心与真诚参与,给尚不完美的模型提供高质量的数据反馈。 全球首款实现多模态输出的类ChatGPT产品 3月16日下午两点,万众瞩目的邀请测试展示如期召开。李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。 上海交通大学计算机系专攻大语言模型方向的博士生陈星宇全程观看了发布会。在他看来,整场演示内容流畅,亮点不少,达到了他的预期。而演示最出彩之处当属文心一言将一段文本生成了图片、音频和视频,这是全球发布的产品级大语言模型中首个实现多模态输出的模型——即使是前一天发布的GPT-4,也只展示了多模态输入功能。 多模态输出意味着什么?陈星宇表示,目前尚没有一篇正式出版的文章介绍多模态输出是如何实现的,这属于百度自己的“独门秘籍”。据他猜测,应该是百度整合了多个不同类别的大模型的结果。而要把这些模型无缝整合到一个对话系统中,并实现流畅输出,其中有很多工程技术难题需要解决,比如优化。“百度在这方面做得很好。”他说。 仅从演示看,陈星宇认为文心一言达到了类ChatGPT的水准。但遗憾的是,演示并非实时,这也让不少欲亲自参与测试的网友大呼“不过瘾”。 人类“循循善诱”,才能让机器输出更好答案 此次,文心一言没有开放大规模公众测试,而是采用发放邀请码的方式邀请小部分用户参与体验。对此,部分网友表示不理解。 但在业内人士看来,这其中有更深层次的考量。“现阶段的文心一言,更需要有明确任务的使用者,而非打发无聊时光的对话者。”陈星宇说。 试想一下,当你把语言模型当成生产力工具,让它帮助你完成一项工作时,如果它输出的内容不能满足你要求,你可能会尝试改变提问的角度或输入更多有价值的信息,以便让答案更符合你的预期。而当你只是想聊天时,或许就没那么认真了,你输入的内容也许漫不经心,也许有些小错误,甚至你还会暗自期待它犯错。 事实上,最新发布的GPT-4演示也证明了人类的“循循善诱”是如何让机器输出更完美答案的:演示者通过让GPT-4代入某种角色,并交代了四个回答问题的步骤,教会他产出令人满意的回答。 复旦大学计算机学院教授、深耕人工智能和自然语言处理20余年的黄萱菁表示,高质量的语料库和优质的人类反馈,是造就ChatGPT优异表现的两大关键因素。对于其所在实验室正在训练的类ChatGPT模型MOSS,他们也将通过更高质量的中文数据进行性能优化。 多一点耐心,给中国类ChatGPT更多成长机会 当下,生成式人工智能的表现虽然令人惊艳,但远未达到完美无缺的程度。即便是大受褒奖的GPT-4,在其公布的报告中也坦言,他们仍然无法彻底解决大语言模型的幻觉问题。相比ChatGPT,GPT-4回答事实性问题的准确率已达到80%,ChatGPT只有60%。 想要通过大语言模型得到令人满意的答案,耐心必不可少。一位网友反映,他用了8个问题引导,才让ChatGPT给出了勉强令人满意的答案。 上海交通大学计算机系助理研究员陈露透露,在类ChatGPT赛道上,中国已拥有许多不亚于文心一言规模的大语言模型,如浪潮的“源”、华为的盘古、阿里巴巴的PLUG,腾讯、字节等互联网大厂也有未公开的模型。“这条赛道,中国并非没有机会,但需要给它们更多成长空间。” 自今年2月百度官宣文心一言以来,已有超过650家企业宣布接入文心一言生态。随着大批由任务驱动而产生的高质量数据的涌现,文心一言将在与用户的互动与反馈中快速学习和成长。 “ChatGPT的成功表明,人工智能已经找到一条对的路。既然路走对了,迭代速度将是很快的。”黄萱菁说。以应用为驱动的人工智能,将通过真实用户反馈、开发者调用和模型迭代之间的飞轮快速进化,或许今天尚显稚嫩的模型很快就能达到“士别三日,当刮目相看”的效果,但眼下我们需要的仍是耐心与宽容。 作者:沈湫莎 责任编辑:任荃 *文汇独家稿件,转载请注明出处。 举报/反馈
ChatGPT狂飙,浙江高中生向人工智能专家张文宇犀利提问
本科论文

ChatGPT狂飙,浙江高中生向人工智能专家张文宇犀利提问

由于ChatGPT等人工智能大模型的“狂飙”,浙江财经大学二级教授、博士生导师、盈阳金融科技学院院长兼人工智能研究院院长张文宇近期接连在浙江省多所一级重点中学,包括严州中学、杭州四中、效实中学、宁波二中等,作《从AlphaGo到ChatGPT:AI思维与智慧学习》等新一代人工智能相关主题的生涯规划演讲。各中学的报告厅座无虚席。 张文宇教授以贴近00后的语言风格,讲述了人工智能这一高深话题。他表示,人工智能已无处不在。同时引导大家思考:在人工智能技术飞速发展的时代,年轻人该如何学习,后ChatGPT时代的个人前途和国家前途又在哪里? 在互动环节,高中生们大胆地提出犀利的问题,张文宇赞扬了当代高中生开放、前沿的思维能力,并一一作答。 问:我们寒窗苦读多少年才能学会的东西,ChatGPT几分钟就完成。既然这样,我们努力学习还有用吗? 答:相对于过往的只擅长单方面知识的弱人工智能如AlphaGo,ChatGPT作为一个预训练大语言模型通过预训练阶段获得了大规模的综合基础知识积累,可以说是敲开了强人工智能的大门。人类的中小学阶段并不涉及行业知识的学习,因此也是一个预训练过程。在预训练阶段,人类不能跟ChatGPT比死记硬背,而是要站在ChatGPT的肩膀上,去提升自己的创造力、想象力、情感力,成为智能机器的主人。 问:使用ChatGPT,我们不需要懂汉语、英语、方言,只需要用自己的母语说出指令即可。既然这样,我们还需要学语言学吗? 答:ChatGPT虽然上知天文下知地理,但是它毕竟是由人类编写的程序所构成的,并不能像人类一样理解语言背后的文化、情感和人际关系等方面。例如,同学们都熟悉的新东方网红老师董宇辉,他那蕴含着人类共情心的内容创新,是不懂真善美的虚拟主播所实现不了的,也是吸引那么多群众关注的原因,因为都想当他的丈母娘 问:机器越来越智能、越来越像人,让机器负责赚钱养家、让人类负责貌美如花不好吗? 答:人若主动躺平而失去工作,这不符合马斯洛需求理论所提出的人类区别于动物的高层次自我实现需求,人类有点退化到动物了;劳动是人的第一需要,因此,同学们要去实现机器不擅长、蕴含着人类意识和人性光辉的基础创新、内容创新、平台创新、模式创新、特别是文理商工跨学科融合创新,通过满足高层次自我实现需求,为社会做出更大的贡献而变得更像人。 问:ChatGPT为什么首先诞生在国外,而不是中国? 答:人工智能产业分基础层、技术层、应用层,我国在人工智能应用层处于国际领跑,在人工智能技术层处于并跑,在人工智能基础层处于跟跑。ChatGPT的核心竞争力来自于基础层的大数据、大算力与强算法。中国在人工智能基础层与先进水平的差距当然会影响中国版ChatGPT的性能。因此,要改变这个局面,中国科技人才、包括青年学生需要在基础研究、特别是从0到1的创新上有更多的定力、花更大的功夫。 问:ChatGPT、文心一言等带来密集的人工智能进展,我们和国外高科技差距在加大还是缩小?我们如何为中华民族伟大复兴尽自己的力量? 答:从2022年11月30日ChatGPT发布以来,在世界上掀起了一场人工智能大语言模型竞争,微软、谷歌、百度、阿里巴巴、华为等巨头都纷纷加入。ChatGPT赛道对世界的影响是堪称爆炸级的,中国不能缺席也无法缺席。虽然中国版ChatGPT如百度的文心一言目前与国外竞品有一个技术代差,但令人欣慰的是,在ChatGPT发布之后的三个月,文心一言也就发布了,这样的亮剑精神令人尊敬。在中学阶段,你们要耐心打好基础,学会与“机”共舞、鹤立“机”群。 “转载请注明出处” 举报/反馈
ChatGPT背后的AI背景、技术门道和商业应用(万字长文,建议收藏)
本科论文

ChatGPT背后的AI背景、技术门道和商业应用(万字长文,建议收藏)

作者:京东科技 李俊兵 各位看官好,我是球神(江湖代号)。 自去年11月30日ChatGPT问世以来,迅速爆火出圈。 起初我依然以为这是和当年Transformer, Bert一样的“热点”模型,但是当一篇篇文章/报告不断推送到我的眼前,我后知后觉地发现这次真的不一样。 很直接的一点是,ChatGPT已经影响到非AI、非互联网、非计算机的每一个人了。 你会看到,众多科技界大佬,马斯克、纳德拉、李开复、李彦宏、周鸿祎等,都在发声称 ChatGPT 将改变世界; 太多的互联网公司,如微软、谷歌、百度、阿里、腾讯等正在抢占商业先机; 还有更多的学术机构、高校也开始讨论 ChatGPT 生成论文是否符合学术规范; 突然之间各行各业从业者开始担忧被 ChatGPT 替代…… 「初看以为是热点,再看已成经典…」 于是我决定好好研究它一番,并力争把它写得全面而通俗易懂一点,最终就有了这篇万字长文报告,建议收藏、慢慢阅读。 文章主题关于:「ChatGPT背后的AI背景、技术门道和商业应用。」 以下是目录和正文内容: 引言 我和聊天机器人的小故事 一、 AI背景 1.1 ChatGPT的出圈和能力圈 1.2 人工智能发展简史 1.3 ChatGPT背后的NLP和Transformer 二、技术门道 2.1 GPT-1到ChatGPT的演进和技术原理 2.2 ChatGPT的局限性 2.3 ChatGPT的优化和探索方向 三、商业应用 3.1 国内外资本投入层层加码 3.2 ChatGPT商业化序幕已经拉开 3.3 ChatGPT助力AIGC浪潮再起 后记...