文章主题:
AI
聚焦人工智能
自美国AI公司OpenAI于2022年11月30日发布全新通用型对话系统ChatGPT并免费开放网页端试用功能以来,经过短短5天,活跃人数就超过100万,2个月的活跃人数就达1个亿,打破了史上增长最快的消费者应用程序的记录。ChatGPT在写提纲、编邮件、优化语句、合成代码、修复Bug等要求下的内容生成,不仅效果优异,在完成速度上也有着优越的表现,展现了ChatGPT文本生成能力的强大应用场景。与之前推出的小冰、小度、Siri等对话机器人相比,ChatGPT的回复更为智能,大多数情形下能够结合上下文形成“有逻辑的对话”,实现了从“人工智障”到“强人工智能”的跨越性转变。2023年3月15日凌晨,OpenAI再次推陈出新,发布多模态预训练大模型 GPT-4。OpenAI声称:“这是OpenAI努力扩展深度学习的最新里程碑。它接受图像和文本输入并进行文本输出,虽然在许多现实场景中它尚不如人类,但在各种专业和学术基准上已表现出与人类相当的性能”。这意味着生成式人工智能将不限于文本领域,借助人工智能直接生成图像、视频等素材的愿想正在逐步迈向现实。ChatGPT的横空出世,使人工智能的发展进入全新的阶段。英伟达CEO黄仁勋表示“ChatGPT 相当于 AI 界的 iPhone 问世”。那么,ChatGPT由何而来,为何而生,又向何而去?在这个过程中,人工智能本身面临怎样的风险与挑战,又会对人类社会生态和就业环境造成怎样的影响?对这些问题的解答构成了本文的逻辑主线。
NO.1
由何而来——ChatGPT的发展历程
现有ChatGPT的问世并非一蹴而就,在此之前,OpenAI已为ChatGPT基础模型的构建进行了长达5年的筹备与测试。2018年OpenAI发布了第一代GPT(Generative Pre-trained Transformer)模型,利用Transformer的神经网络架构,通过在大规模语料库上进行预训练来生成自然语言文本,从此自然语言处理进入“预训练”时代。在接下来的几年里,OpenAI不断改进和扩展GPT模型,推出了GPT-2、GPT-3等版本。这些模型在生成自然语言文本方面不断取得新的突破,并引起了学术界和产业界的高度关注。其中,GPT-3模型已含有1750亿超大规模的参数,并且能够借助语境学习(In-context Learning),判断语句的褒贬。比如,输入“我觉得你很有趣,这句话的情感是——”,那么GPT-3直接能够输出结果“褒义”,这标志着人工智能开始具备对文字情感的感知能力。
基于GPT3.5 并加入监督数据微调得到的 ChatGPT,可以通过学习和理解人类语言,用对话的方式进行交流,这种形式不仅能够提升用户的交互体验感,而且能够根据用户反馈进行回答调整和细化,从而更好地理解和满足用户的具体要求。ChatGPT在对话、写作等多方面的优秀表现,掀起了预训练大模型的浪潮,学界和业界纷纷开始迅速启动并跟进研制自己的大规模预训练语言模型,以追赶新一代AIGC(AI Generated Content)的风口浪尖。与此同时,OpenAI也在不断改进GPT模型的训练和应用方式,除ChatGPT外,OpenAI还开发了一个能够根据文字描述生成相对应图像DALL-E的模型。
3月15日,GPT-4震撼发布,在文字输入篇幅、回答准确性等方面实现了质的跃升,还可以生成诗歌等创意性文本,实现风格变化。为了让人们直观感受GPT-4带来的全新升级,OpenAI的总裁和联合创始人Greg Brockman还亲自在YouTube上发布直播,实时演示Live Demo中GPT-4的强大功能——报税、写诗、代码自动纠错……GPT-4轻松解决了原本GPT3.5难以达成的任务目标。据悉,OpenAI用了6个月的时间改进ChatGPT的使用缺陷并使用对抗性测试程序对GPT-4进行迭代调整,从而在可控性和真实性等方面取得了有史以来的最佳表现。此外,GPT-4开始接受图像作为输入介质。比如,用户可以向ChatGPT发送冰箱内的食材照片并征求食材分类存放的建议,学生也可以发送专业题目的截图并要求ChatGPT给出参考答案。
ChatGPT迅速引爆了新一轮AI军备竞赛。谷歌于2023年2月7日宣布即将推出由LaMDA模型支持的对话式人工智能服务Bard,在此之后仅仅24个小时,微软迅速上线了基于ChatGPT 类技术的 New Bing,并计划将 ChatGPT 集成到 Office 办公套件中。除此之外,苹果、亚马逊、华为、阿里巴巴等企业也均明确表态正在进行类 ChatGPT 模型研发与布局。在这个有望超万亿元的AIGC超级赛道里,谁能引领技术先机,谁就将率先掌握定价权,迎来庞大的市场份额和商业空间。
NO.2
为何而生——ChatGPT的广阔应用场景
ChatGPT内容生成的智能性和涉及领域的广泛性给人类带来了极为多元的应用场景。本文带来三个较为实用的个人使用案例,但ChatGPT的用途远远不止于此,更加具有针对性的应用场景有待进行探索与尝试。应用案例之一——协助撰写商务邮件对于一些初入职场的企业员工、外贸交易的供应商、经销商以及学者等人而言,撰写商务邮件,尤其是英文商务邮件是必不可少的一项工作,然而对商务邮件写作的不擅长或对于语法及格式错误的担忧让很多人望而却步。ChatGPT不仅能够根据输入提示撰写完整的邮件模板与内容,也可以协助改善其语法与拼写、根据邮件内容自动生成回复。这些不仅解决了人们对于语法和格式的烦恼,也可以帮助用户在时间紧迫或者不确定如何表达自己的情况下快速起草邮件,并且逻辑通顺、要点明晰、符合职场礼仪。输入提示参考:假如你现在是一名外企员工,请写一封邮件提醒同事尽快完成流程审批,要求按照商务英文标准。应用案例之二——生成文章提纲ChatGPT能够很好地帮助文字工作者构建提纲、形成观点、补充素材,甚至能够直接根据要求形成一篇完整的报告,这将极大提升文字工作者的写作效率。目前,已有英国曼彻斯特大学的学者与ChatGPT联合撰写学术文章,并公开发表在期刊Nurse Education in Practic上,展现了ChatGPT文字撰写功能的强大作用。值得注意的是,由于ChatGPT有最大token数量的限制,因此让ChatGPT直接撰写长篇幅文章还较为困难。借助ChatGPT生成文章提纲或摘要,将需求主题分块输入提示是相对有效的替代性做法。输入提示参考:请扮演南京市江北新区的核心决策机构,结合中央,地区政策,写一篇关于江北新区2035产融结合战略规划,产业布局,数字经济转型的论文,请给出文章大纲和主要观点。应用案例之三——代码开发GPT4的发布会上,OpenAI 的总裁和联合创始人 Greg Brockman 展示了 GPT-4的强大编程技能:他在草稿本上用纸笔画出一个非常粗糙的草图,并拍照告知GPT-4需要按照图片的效果生成网站代码。令人震惊的是,GPT-4用时十秒左右就构建出了功能齐全的html/css/JavaScript网站。对于程序员而言,利用ChatGPT缩短开发流程、进行代码纠误等将是非常实用的功能。输入提示参考:我需要构建如图所示的网站,请生成网站代码。
NO.3
向何而去——ChatGPT的未来增长空间
现阶段,大规模预训练语言模型的应用场景还主要体现在自然语言处理(Natural Language Processing, NLP)上,因此在引擎搜索、聊天机器人、航程辅助等领域应用广泛。在可见的将来,智能家居、工业视觉、行业化机器人等多模态方案将逐步落地,医疗、教育等AI行业专家,工作、购物等AI助理也将走入人类生活。进一步地,结合复杂多模态方案的大规模预训练语言模型将完整地具备与世界交互的能力,将在通用机器人、虚拟现实等领域大放光彩。
针对ChatGPT现存问题的技术改进路径,首先,ChatGPT不具备是非判断能力导致其生成内容缺乏可信度。有网友评论,ChatGPT对于某些问题的答复实际上是在“一本正经地胡说八道”,由于目前ChatGPT模型所生成的文本是基于现有数据库而编造出来的结果,而这些生成内容还不能提供合理的证据进行可信性的验证,因此往往会编造出现实中完全不存在的事件、人物或网址等信息。尽管GPT-4“响应不允许内容的请求的可能性降低了 82%,产生真实事实的可能性提高了 40%”,比起GPT3.5来说显著地减少了“满嘴跑火车”的频率,但仍无法避免形成推理错误。其次,ChatGPT的高昂成本和模型部署的复杂程度导致模型每次调用花费成本高,并且可能会出现延迟,对算法和算力具有很高的要求,因此如何对模型进行精简化和瘦身也是未来的发展方向。
短短的一年内,人类见证了生成式人工智能傲人的发展速度和强大的应用前景。伦敦国王学院深耕与计算创造力领域的研究员迈克·库克(Mike Cook)表示:“这项技术的确令人惊叹,这是新技术该有的样子。但它发展得如此之快,以至于人类的认知根本赶不上它的更新速度。整个社会都需要花上一段时间进行消化。”未来,人工智能新技术和新应用也将不断刷新大众的认知,将世界拉入人工智能发展的快车道。
可以预见的是,从文本到图像的自动生成可能只是OpenAI发挥创造力的开始,音频、视频、 3D动画……人们会逐渐意识到,阻碍人工智能产出的将不再是技术或算法,而是人们的想象力。
NO.4
风险向内——ChatGPT带来的挑战
在ChatGPT不断迭代更新的同时,对AIGC产物所存在挑战的讨论也与日俱增。这一部分由ChatGPT当前的技术限制所引发,另一部分则是由人类对ChatGPT的不当使用所导致。本文以ChatGPT可能带来的隐私泄露、信息伪造和伦理道德风险为例,洞察AIGC的发展给人类造成的可能挑战和并尝试给出应对举措。
隐私泄露。用户在使用ChatGPT过程中,输入的文本内容可能会包含敏感信息,例如个人身份、财务信息等。若这些信息被 ChatGPT 收集和记录,那么就可能会被未经授权的第三方访问和使用,导致隐私泄露风险。此外,ChatGPT 可能会通过分析用户的对话历史记录,获得用户的喜好、兴趣和行为习惯等敏感信息。如果这些信息被滥用,就可能会导致用户的隐私泄露。为此,ChatGPT应当对用户输入数据进行加密,并设置数据保留期限,确保及时删除用户私密信息。同时,ChatGPT管理人员应当定期进行数据安全审计和风险评估,及时发现和解决可能存在的数据泄露问题。
信息伪造。由于ChatGPT不具有对错判断能力,也无法借助合理依据对生成内容进行可信度的验证,因此可能会生成虚假信息,例如伪造用户的对话内容、创建虚假新闻报道等,从而对公众造成误导。若这些虚假信息被ChatGPT快速合成并广泛传播,将造成网络虚假信息泛滥,网络用户将更加难以甄别这些信息的真伪。为此,ChatGPT未来应当持续提升对合成信息真伪的识别能力,并采用图像识别和语音识别等多种技术手段尝试过滤虚假信息。
伦理道德。由于训练数据的来源和质量参差不齐,ChatGPT可能会习得偏见和歧视性,并将这些特征表现在生成的文本中。例如,它可能会重复流行的性别和种族刻板印象,或者用含有歧视性的语言描述特定群体。为此,未来有必要建立更广泛和多样化的训练数据集,以减少数据源的偏见和歧视性。此外,可以使用一些技术手段来检测和修正ChatGPT生成的偏见和歧视性文本,尽量避免算法歧视问题的出现。
NO.5
辐射向外——就业替代和社会极化风险
随着人工智能的不断发展,面向消费者的产品也不断推陈出新,无论是AI生成图画,还是直接生成文本内容,都展现出了其强大的深度学习能力和广阔的发展空间。在人工智能给人们带来新的惊喜的同时,人工智能是否会造成就业替代这个话题也再一次冲向风口浪尖。
根据人大国家发展和战略研究院的测算,人工智能对制造业和批发零售业两个行业的平均替代率分别为 43%和57%,由于我国企业就业人口多半在这两个行业就业,将有约45%的城镇就业人口存在可替代的风险。以重点行业为例,针对金融行业,人工智能技术已经深入前、中、后台全过程,智能化建设的推进使银行业务线下人工处理率不断下降,股票交易决策支持、研究分析、风险建模和智能投顾的落地也将对传统金融从业者造成替代;针对医疗行业,人工智能技术可以通过分析X光、CT扫描、MRI等医学影像图像,更快速、更准确地诊断患者病情。在电子病历管理和医疗保险审核方面也将展现出极大的优势;针对制造业,自动化生产线、机器人存储、搬运和配送以及数据分析优化企业决策等都将对传统制造业工作造成替代。
如果说自动化产业的革新避免了蓝领工人的机械化劳作,那么AIGC的诞生将对众多白领和脑力工作者的就业空间造成威胁。AIGC能够大规模学习人类已有的知识,并迅速进行消化与输出,在一些领域的信息收集和写作能力甚至不亚于人类,无疑给内容创作行业带来了全新的挑战。自然语言生成技术(NLG)未来可能将应用于新闻报道、文案、广告、评论等文本的生成,从而取代一部分记者、编辑、评论员在相关领域的工作。此外,AIGC还可以借助图像、音频和视频生成技术来生成各种类型的内容,进而生成虚拟人物、场景、物品等,从而对游戏设计、虚拟现实和影视特效等领域工作者造成就业替代。
常规性工作岗位的大量替代导致社会财富聚集在少部分高精尖领域人群手中,可能会加剧我国贫富两极分化,造成社会及政治不平等。简单、重复性的人力劳动被人工智能大面积取代,而高技能、高收入的工作将更多地集中于人工智能技术领域。此外,许多科技公司和大型企业开始垄断数据和技术资源,拥有更多的财富和市场优势,形成“赢者通吃”效应。这进而导致中小型企业和创业公司在竞争中难以生存,而大型企业和技术巨头则可以进一步扩大自己的市场份额和利润,加剧贫富差距和社会分化。
NO.6
拥抱未来——是机遇还是挑战?
尽管人工智能对会部分重复性高、创造性不足的行业及岗位造成一定的就业替代,但同样会激发全新的业态和岗位需求。普华永道于2018年1月发布报告《人工智能和相关技术将对中国就业市场产生什么净影响?》。报告指出,人工智能及相关技术在未来20年将取代中国现有约26%的工作岗位,但与此同时,随着生产效率和实际收入水平的提高,这些技术也会创造许多新的就业。对于中国就业的净影响,报告认为,人工智能将净创造约12%的新增岗位,相当于未来20年内增加约9,000万个就业岗位。
在人工智能机遇和挑战并行的时代,我们无法阻碍人工智能发展的热潮,拥抱人工智能未来、不断提升个人技能和创造力以应对不断变化的工作需求是最明智的选择。复旦大学计算机学院教授黄萱菁表示,未来一段时间内,ChatGPT还不足以完全替代某一个岗位,但将大大促进各个领域的生产效率:“在肉眼可见的未来,善用AI的人将和不用AI的人在工作效率上会产生巨大差距,因此我鼓励大家多去使用和熟悉与AI进行沟通。”
作者简介
高元
Gao Yuan
南京大学商学院硕士、长江产业经济研究院研究助理。
叶明
Ye Ming
管理学博士,长江产业经济研究院研究员。曾获第二十二届“安子介国际贸易研究奖”、中国新兴经济体年会优秀论文二等奖、中国数量经济学年会优秀论文奖等。
长江产经
智库
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!