文章主题:ChatGPT, 发展, 治理, 技术

666AI工具大全,助力做AI时代先行者!

九卦 | 祝世虎:ChatGPT的发展与治理

作者 | 祝世虎 光大信托科技部副总经理、数据中心总经理;CIC金融科技和数字经济发展专家委员会委员

来源 | 《中国银行业》杂志2023年第5期

导语:回顾人类历史,技术和伦理紧密交织,面对科林格里奇困境,笔者认为,社会伦理优先于技术创新。

在新兴技术的设计和开发过程中,应优先考虑和满足为人类服务的伦理要求,最大限度利用技术创新造福人类。结合我国国情,对于AIGC的治理分为监管治理、行业自律、企业自治、全民共治四个方面。

九卦|祝世虎:ChatGPT的发展与治理

ChatGPT发展与治理面临科林格里奇困境

ChatGPT,作为由OpenAI推出的一款聊天机器人,能够以自然的方式与用户进行交互,并具备处理各种复杂语义任务的能力,如文本生成、自动问答、翻译以及代码生成等。它在人们的生活和工作中的应用范围非常广泛,涉及到众多不同的主体和多个领域。

本质上而言,ChatGPT是AIGC(Artificial Inteligence Generated Content)人工智能生成内容的一种。从技术角度看,AIGC的发展与应用,是一个新技术形成新生产力的问题;从治理角度看,是一个牵一发而动全身的社会问题;从哲学角度看,其中蕴藏着人类与AI边界的哲学问题。

综合来看,ChatGPT的发展与治理是一个典型的科林格里奇困境(Collingridges Dilemma),指的是一项技术如果因为担心不良后果而过早实施控制,那么技术很可能难以爆发,反之如果控制过晚,技术已经成为经济和社会结构的一部分,就可能走向失控,再来解决问题就会变得更加昂贵、更加困难。

ChatGPT的技术分析

从技术角度对ChatGPT的算法分析并不容易理解,笔者尝试从逻辑思维角度解释ChatGPT技术。OpenAI的工程师们接到的任务是:要做一个拥有人类智能的机器;工程师们的思路如下:首先,要创建一个“大脑”;其次,要整理学习资料;再次,掌握学习方法;最后,学成归来。这就是ChatGPT技术路线的逻辑框架。

第一步,构建“大脑”。工程师认为这应该是一个“通用大脑”,这就是通用人工智能AGI的构想:AGI应该是一个大系统,系统的核心是一个与任务无关的“通用”大模型,大模型依靠大算力从海量大数据中学习人类的知识,从而形成AI智能,这一步体现了工程师的系统思维,与通用复用的工程思维。

第二步,整理学习资料。人类知识的载体是文字、语言、图画等,所以,工程师选择了大型语言模型LLM(Large Language Model)。在工程师眼中,大算力、大存储、大数据使得大模型的工程实践成为可能,随着数据越来越丰富,算力越来越强,模型越来越大,效果也会越来越好,这体现了工程师们“力大砖飞”的实用思维,但并没有从算法上对“力大砖飞”进行严格论证。

第三步,掌握学习方法。在当时的NLP(Natural Language Processing)领域,深度学习模型已经遭遇瓶颈,通过增加模型层深来提升模型效果微乎其微,深度学习模型已经逐步被预训练模型所取代,预训练模型的公式为:模型性能=预训练性能(数据+任务)+微调性能(数据+任务)。

在预训练模型范式中,我们可以看到两种不同的技术实现方式,即BERT(双向编码器表示 transformers)和GPT(生成预训练)。虽然这两种方法的外在表现形式相似,但其内在逻辑却有着明显的区别。回顾过去的研究,我们发现研究者倾向于选择BERT技术,而工程师则更偏向于GPT技术。那么,这种现象背后的原因是什么呢?首先,我们需要了解的是,研究者和工程师在选择这些技术时的思维模式是不同的。对于研究者来说,他们通常遵循一种“按部就班”的方法,即先完成自然语言理解任务,然后再完成自然语言生成任务。这种方法体现了他们的严谨性和步骤性。而对于工程师来说,他们希望能够一步到位,直接完成自然语言生成任务,从而实现更为便捷和高效的处理方式。因此,BERT技术和GPT技术各自有其优势和适用场景。BERT技术在自然语言理解方面的优异表现,使其成为了自然语言生成的有力助手。而GPT技术则以其强大的自然语言生成能力,为工程师提供了一个直接、高效解决问题的方案。在实际应用中,我们可以根据具体需求和场景来灵活选择适合的技术。

GPT1采用预训练方法,专注于语言理解方面;GPT2运用迁移学习技术,有效提升预训练信息的利用率,进而强化语言理解能力;GPT3针对小样本泛化问题进行了优化;GPT3.5借助指令遵循和微调等技术,成功突破人机交互的关键难题;至于GPT4,它实现了上述技术的工程化应用。

第四步,学成归来。随着大算力、大数据的“厚积薄发”,大模型“量变突破质变”,大语言模型的智力涌现(Emergent Abilities of Large Language Models)出现了。

在人类技术的发展历程中,一项新技术的成功实现需要经历三个关键阶段。首先,是在实验室环境中技术的初步胜利。接着,工程师们会对技术成本进行持续优化。最后,产业应用将经过一系列尝试与错误,逐步完善。如今,我们正处于产业应用试错的阶段。

九卦|祝世虎:ChatGPT的发展与治理

ChatGPT的技术缺陷

我们观察到,技术的发展似乎在推动 ChatGPT 的进步,然而,技术本身存在的局限性却使得 ChatGPT 存在一些无法克服的技术问题。

应用平民化,但建模贵族化。应用平民化指的是ChatGPT提供了便捷的API接口,每个人都可以很方便地接入;建模贵族化指的是建模的成本太高了。ChatGPT的训练需要大量的训练样本、大量的算力,这些背后更是数百名工程师以及大量内容提供者。总体而言,在应用平民化的同时,ChatGPT研究却越来越贵族化。

AI“大而不便改”,使得人去适应AI。在ChatGPT的1750亿个参数中,以“某种方式”存储着人类的知识,但这些参数的逻辑关系、学习过程等从技术上却尚未完全明确。这些参数的修改主要是靠训练,而训练依赖的是昂贵的数据集,会产生“大而不便改”的缺陷。所以,这可能会产生一个“反直觉”的问题:究竟是人去适应AI大模型,还是AI大模型去适应人。以人和手机为例,从客户体验角度看,好像是手机在适应人的操作,但本质却是人去适应手机给我们带来的生活方式!

智能缺陷:感知智能而非决策智能。从技术角度智能类型可以分为三类:基于贝叶斯公式的感知智能、基于先验概率的决策智能、基于计算公式的计算智能。从前述ChatGPT的技术分析不难看出,ChatGPT是通过文本语言等训练的模型,其智能类型是受限的,是局限在文字语言领域的感知智能,而非决策智能,更不是计算智能。

智能缺陷就是ChatGPT的使用边界。例如,在金融机构中,ChatGPT不是决策智能,若用于风险决策将受到限制;ChatGPT不是计算智能,若用于资本计量也将受到限制;ChatGPT是语言领域的感知智能,是可以以文字助手的身份嵌入大部分与文本相关的工作。

AI算法固有缺陷。提起ChatGPT有人可能会有疑问,为什么ChatGPT只提供了API接口而很少开源,这就揭示了ChatGPT作为一种人工智能算法的固有缺陷:算法黑箱、算法鲁棒性、算法歧视等。算法黑箱,是指由于算法模型的黑箱运作机制,其运行规律和因果逻辑并不会显而易见地摆在研发者面前。算法鲁棒性,指的是算法运行容易受到数据、模型、训练方法等因素的干扰。算法歧视,指的是算法以数据为原料,如果初始使用的是有偏见的数据,无形中会导致生成的内容存在偏见或歧视,引发用户对于算法的公平性争议,这种歧视可能主要来自于资本对于训练数据的控制。

ChatGPT是一种基于数据训练的人工智能模型,其输出的结果仍然是数据。然而,从技术角度来看,开发公司在处理数据时对数据安全的关注不够充分,这可能导致该系统存在潜在的数据安全漏洞。此外,在与用户数据交互的整个过程中,也可能会出现风险和合规问题。因此,为了确保该系统的安全性,开发公司必须加强对数据安全的重视,并采取相应的安全措施来保护用户数据。

一是训练数据的获取,ChatGPT通过抓取互联网上的信息获得训练数据,可能存在合规问题。

二是在个人信息收集阶段,当用户使用ChatGPT时,可能会输入个人数据,根据《个人信息保护法》要求需要单独授权。

三是在个人数据的加工使用阶段,ChatGPT使用了RLHF(Reinforcement Learning from Human Feedback)的训练方法,即以强化学习方式依据人类反馈优化语言模型,用户使用过程中的输入和交互信息可能会用于持续迭代训练,进一步被用于为其他用户提供服务,从而可能构成数据共享,这时已与用户最初数据使用目的和范围相悖,根据《个人信息保护法》要求需要重新授权。

四是数据泄露,用户在使用过程中输入的信息,以及企业用户输入的各类工作信息,可能导致公司敏感信息泄露。

五是算法缺陷导致数据主体行权困难,ChatGPT的算法黑箱与算法复杂性导致数据主体的基本权利,如更改权、删除权、访问权等行权困难。

ChatGPT的潜在风险

ChatGPT所引发的潜在社会问题主要来自工作岗位、“机器宣传”、人与AI的边界等方面,以及由此可能造成的一系列社会风险。

工作岗位被取代的潜在风险。ChatGPT推出以来,不少新闻报道或文章分析其会取代一些人的工作。ChatGPT本质上是通过科技创新提高生产效率,是生产力的跃升,这与历史上的生产力提升一样,比如,蒸汽机替代马车、电力的广泛使用替代蒸汽机等,都是以更少的人力去生产商品,让节约的人力进入新兴行业,增加新的商品和服务供给。虽然会在短时间内对人类的就业结构产生冲击,但由于人力资源的稀缺性,中长期不会导致大规模失业的问题,只是就业结构发生了变化。

这种结构变化可以用一句话来概括:一群人的工作是发展AI,一群人的工作是被AI所取代,取代你的不是AI,而是先掌握AI能力的人。

“机器宣传”的潜在风险。ChatGPT为代表的AIGC的内容生成,可以在短时间内制造大量包括文字与图片在内的“新内容”,其受制于训练数据的分布。也就是说,虽然ChatGPT的技术是理性、中立、客观的,但是由于训练数据存在歧视,可能导致输出结果存在歧视,导致“机器宣传”可能存在风险,这种风险在技术中立的掩盖下具有一定的隐蔽性。所以,需要大力推动人工智能工具理性与价值理性的双向平衡,构建内容与监管的融合统一。

“资本逐利”的潜在风险。在ChatGPT之前的一个热点是元宇宙,ChatGPT火爆以后,元宇宙迅速降温,给人的感觉是二者此消彼长。但从技术角度来看,AIGC客观上为元宇宙中UGC(User Generated Content)创作提供了助力。元宇宙设想通过用户创作内容的方式来打造元宇宙,而AIGC本身就是内容创作的辅助工具,通过AI和文本、绘图、视频的结合,形成了元宇宙内容创作的新生态。之所以给人此消彼长的感觉,其原因有三,表面原因是元宇宙的应用生态没有形成,如VR游戏等依然看不到突破;次要原因是流量迁移,即元宇宙的流量向ChatGPT的迁移;根本原因是资本的短期逐利性,资本来了又走,是一个阶段的结束也是另一个阶段的开始。

潜在的法律风险。一是著作权。ChatGPT生成的文学作品、代码等存在着著作权归属不清的问题。主要包括:我国现行知识产权法律体系均规定法律主体为享有权利、负有义务和承担责任的人。

二是可能助长信息网络犯罪活动罪。所谓帮信罪,即帮助信息网络犯罪活动罪,我国《刑法》第二百八十七条明确规定,明知他人利用信息网络实施犯罪,为其犯罪提供互联网接入、服务器托管、网络存储、通信传输等技术支持,或者提供广告推广、支付结算等帮助。比如,犯罪分子使用ChatGPT的文字生成功能,形成极具说服力的钓鱼电子邮件或消息,冒充人类或者组织骗取他人信息。

三是拒不履行信息网络安全管理义务罪。ChatGPT的运营商,作为信息发布的网络内容服务提供者,需要履行信息网络安全管理义务。若被监管部门要求责令整改,而ChatGPT的运营商无法提供有效的管理措施,致使违法信息大量传播,可能涉嫌拒不履行网络安全管理义务的违法行为。而前文提及的ChatGPT“大而不便改”的缺陷,则加大了“运营商无法提供有效的管理措施”的可能性。

潜在的未知风险。人与AI能否“和谐”相处,关键是能否达成“共识”,这是一个潜在的未知风险。例如,人类认为:人具有创造性,AI无法开展创造性工作,但AI“认为”:AI使人类的创造力大幅提升。人类认为:毕加索的画是抽象的创造性,但AI“认为”:毕加索的画风不过是一个模型,通过参数调整会生成多幅毕加索的画。人类认为:人类在利用AI扩展人的智能,但AI“认为”:AI在利用人展示它的智能。所以,当“机器宣传”的能力超过了原有的信息渠道;当AIGC产生的文字超过了人类历史积累的文字;当非人类情感的思想被机器开发出来;当AI“过度智能”变得比人类更聪明;当硅基生产力超越碳基生产力,人类如何掌握对人类文明的控制,这也是一个值得深思的哲学问题。

九卦|祝世虎:ChatGPT的发展与治理

ChatGPT的治理

回顾人类历史,技术和伦理紧密交织,面对科林格里奇困境,笔者认为,社会伦理优先于技术创新。在新兴技术的设计和开发过程中,应优先考虑和满足为人类服务的伦理要求,最大限度利用技术创新造福人类。结合我国国情,对于AIGC的治理分为监管治理、行业自律、企业自治、全民共治四个方面。

监管治理:技术与内容并重。我国正在形成相对完善的法律体系,由《网络信息内容生态治理规定》《网络数据安全管理条例(征求意见稿)》《互联网信息服务深度合成管理规定(征求意见稿)》等政策法规强调对内容的治理;《互联网信息服务算法推荐管理规定》等强调对技术的治理,这体现了技术与内容并重的治理思路。建议在上述治理成果的基础上,进一步加强对ChatGPT内容产业与应用模型的方向性引导。

行业自律:伦理先行、统筹发展。国家新一代人工智能治理专业委员会在2021年发布了《新一代人工智能伦理规范》,提出将伦理道德融入人工智能研发和应用的全生命周期。《中国关于加强人工智能伦理治理的立场文件》中明确写到,人工智能治理应坚持伦理先行,通过制度建设、风险管控、协同共治等推进人工智能伦理监管;应加强自我约束,提高人工智能在研发过程中的算法安全与数据质量,减少偏见歧视;应提倡负责任使用人工智能,避免误用、滥用,加强公众宣传教育。建议成立行业联盟,统筹龙头企业、研究机构和标准化组织等发挥协同优势,联合制定公约、标准、指南、准则等行业制度规范,建立可信赖的AIGC技术框架、标准体系、评测机制等。

企业治理:主体责任与社会职责。《关于加强互联网信息服务算法综合治理的指导意见》明确提出强化企业主体责任。同时也需要企业践行科技向善理念、积极履行社会职责,例如,社会伦理、安全底线、内容治理等职责。建议加强企业与政府部门和行业组织的治理合作,为其提供可靠的技术能力,例如,内容审核技术能力、紧急辟谣技术能力等。

全民共治:提升防范意识,营造良性发展环境。一是深化公众对于AIGC技术滥用所带来的风险和危害的认知;二是提高广大群众对于虚假信息的鉴别能力;三是鼓励广大群众主动参与内容与传播等环节的舆论监督。全面共治,共同营造良性发展的生态。

(本文原载于《中国银行业》杂志2023年第5期)返回搜狐,查看更多

责任编辑:

九卦|祝世虎:ChatGPT的发展与治理

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!