文章主题:)”
来源:意见领袖
文/意见领袖专栏作家 张宁
为了全面探讨ChatGPT对保险业的影响,本研究首先深入剖析了ChatGPT的性能特点与潜在优势,进而讨论了其在保险公司中的实际价值所在。在此基础上,进一步挖掘ChatGPT思想给保险行业带来的启示,并展望了以ChatGPT为核心的AIGC技术在保险业的广泛应用前景及可能引发 industry 的变革。值得注意的是,尽管文中未实际运用ChatGPT,但本研究仍基于其性能指标与潜在应用场景进行了深度剖析,以期为保险行业提供有益的参考。
一、ChatGPT的能力如何评价?
为了分析ChatGPT的能力可以从其内在机制和外在表现两个视角入手。
在本文中,我们将探讨许多与人工智能相关的具体技术,并尽可能简洁明了地阐述它们。值得注意的是,尽管OpenAI尚未公开ChatGPT的完整技术细节,但关于ChatGPT的技术原理,我们主要依据其“出生证明”来进行了解(如图1所示)。这表明,虽然OpenAI没有详细公开ChatGPT的技术细节,但通过这些信息,我们可以对ChatGPT的基本原理有一个大致的认识。
首先,ChatGPT与InstructGPT(其兄弟模型)具有相似性,这使得我们能够通过分析公共的InstructGPT来深入了解ChatGPT。
第二,ChatGPT通过交互对话方式训练的;
第三,ChatGPT能够回答问题、承认并纠正错误且能够拒绝不适当的回答等(能力)。
图1:ChatGPT的“出生证“
InstructGPT是一个公开的信息来源(图2),它呈现了一个完整的三阶段策略,这是一个融合了“强化学习”与“模仿学习/比较学习”的解决方案。具体来说,类强化学习体现在第二步中构建奖励模型(函数)并应用于第三步。而模仿学习的应用则源于其训练方式采用了排序(偏好)方法(如InstructGPT的原版论文所示),同时,它在损失函数的构建中也纳入了一部分(权重)调整的GPT3输出(也就是说,它以GPT3为目标,从而构成了一个迭代升级的关系)。因此,我们可以推测,New Bing所使用的GPT4也是在与ChatGPT(GPT3.5)的基础上进一步提升形成的。从人工智能的角度来看,这实际上是一种系统性增量学习的过程。
GPT的简称是Generative Pre-trained Transformer。Transformer模型在业界享有盛誉,尽管目前正面临MLP的挑战,但它依然在模型中充分发挥了语义元素相关性提取的能力。更为关键的是,Transformer所构建的多层结构能够抽取相关性的特征,这也是GPT具备令人敬佩的“写作创作”能力的基础。然而,需要注意的是,GPT的本质仍然是训练语料的各种特征组合后的条件分布排序,这限制了它在能力和应用上的进一步提升。
GPT的上限虽然相对较低,但是其基于定域概念试题元素构建的知识实际上已经涵盖了人类生产生活的绝大多数场景。然而,在某些特定的领域,例如法律、大部分金融行业以及强调同行认同的论文报告生成等方面,超域概念试题和元素(或对其不承认)并未被广泛应用。接下来,让我们来详细了解一下ChatGPT的实际表现。
图2:ChatGPT来源InstructGPT原理图
2.ChatGPT的能力表现
鉴于上述原理中第三步骤的存在,ChatGPT的实际能力是在持续地迭代与升级的。下面,我们将结合本文撰写的时间点(2023年2月10日),来详细阐述ChatGPT相应的能力表现。
让我们先探讨一下ChatGPT在数学方面的表现。由于其内部的运作方式,人们普遍预期它的数学能力不会太强。事实上,如果你直接向ChatGPT询问,它会毫不保留地告诉你自己的数学水平相当于小学六年级。然而,具体它的数学能力究竟如何呢?我利用了标准数学能力测试的标准题目库,为了避免其他人“教育”过ChatGPT,我对题目进行了描述和数字的调整。结果发现,ChatGPT大约能在数学5年级的水平上获得及格以上的成绩。的确,它在解题能力方面与中国的小学六年级还存在一定的差距,这也说明ChatGPT在数学知识方面需要进一步丰富和拓展。
例如这道题:
一共有11个托盘,上面共有370个包裹,相邻的托盘包裹数不能一样。但是任意三个相邻的包裹数合计99。问第六个托盘上的包裹数是多少?
在我的一顿启发下,ChatGPT开始各种胡乱蒙(条件概率生成)。为了尊重ChatGPT的“人权“,咱们暂定它的数学能力(分析推理)就是小学六年级把,注意区分这不是数学知识掌握程度的判断,数学知识可以通过语料覆盖到所有可能的级别,然而如同我们都学了实变函数,但掌握的其实不多一样。
这个结论实际上并没有降低多少ChatGPT在工作中替代人类的可能性——因为大多数工作其实小学五年级的数学就够了,多少工作人士已经忘记了微积分和二次函数。
因为后面要分析它对保险的影响(注意不仅仅是保险行业),接着我们看看ChatGPT的金融保险能力,这方面确实是个优等生。我使用了不同学科的规范试卷(经济学基础、金融学、保险学等六门课程试题)并与学生人工作答的试卷进行了比对,最后的结论是:如果不考虑金融中的数学知识,ChatGPT基本上可以达到研究生的水平,所以国外英文评测ChatGPT通过MBA考试是毫不稀奇的——英文语料决定了其英文水平更强大,所以ChatGPT在中文生成使用了P-翻译技术提高可用性。
以下是一些截图,答得不好的题目:
答得相对及格的例子:
此外在其他领域ChatGPT的能力也大约在大学或研究生水平(图)。这意味着在许多场景下,ChatGPT确实相当于一个对应专业的本科毕业生或者研究生,能够完成对应的工作。
但必须补充两点:
第一点基于前面机制分析,ChatGPT不具有超域概念试题以及知识能力,例如当问及我提出的生命质量理论时,它是“一脸懵逼”的,尽管该理论已经被AGT泰康平安等国内外公司深度应用,并在全球配置了上千亿的资产影响了几十万人。 原因是相关通用生命质量理论目前还局限在全世界高净值人群、较少公司范围内,我们的相关授课讲座也没有形成固定文本,所以对应的语料极少,自然也就没有了“分析”能力——条件概率为0,哎,ChatGPT不懂我啊。
我们总结一下ChatGPT的能力表现:
补充的第二点,New Bing使用GPT4要比ChatGPT(GPT3.5)效果更好,例如对于经济学题目判断更加准确。
我们再举一个上面ChatGPT回答过的问题来感受GPT4的强大,这个回答几乎可以给满分。
二、ChatGPT的能力对保险公司价值几何?
ChatGPT的能力很强大,自然就有各种可能的应用,这里我们主要聚焦于保险公司,看看ChatGPT能够产生哪些价值。 分析某技术对企业的价值,当然可以罗列很多场景,但这其实不能界定它的潜力和方向,更好的方式是用知识经济价值周期论与场景结合。
科技对保险的价值周期分为三个层次,分别是赋能、增能、产能:赋能是被动引入行业主导技术升级,互联网其实就是这一类;增能是以价值为导向主动技术判断和融入,一些大数据技术和隐私计算的上限属于此类;产能是技术融合创造价值,保险里目前大多数科技或者说保险科技的上限离此都有距离。
为了分析ChatGPT对保险公司的价值上限,我们从两个角度探讨,一个角度是其当前的表现,另外一个角度是其内在机制决定的能力上限带来的价值上限。
从当前具有的能力看:
从以上可以看到,ChatGPT当前能力对保险公司的价值上限可以超越赋能,达到增能阶段。但上限不代表可以做到,ChatGPT类应用如果要达到增能价值,需要解决这样几个关键性问题:
第一,ChatGPT的可信性问题,对应于上文我提到的“有限角度”,这从广义上是人工智能的可信性障碍。ChatGPT的对话能力实际作为流程关键要素嵌入,需要确保其方案、输出以及方式符合保险公司规范和监管要求,否则其只能发挥“赋能”作用,仍然需要人员作为主要业务节点。基于人工智能应用的经验,这个问题其实在保险行业类公司其实相对容易解决,这是因为专业部门的可信性障碍是容易解决的,即使在机制上没有办法保证,也有办法通过流程重构跨过这个门槛。
第二, ChatGPT的数学能力障碍需要跨越。保险中的精算等需要超过高中的数学能力,这使得ChatGPT(包括New Bing的GPT4)目前无法发挥实质性作用。该障碍的跨越是可能的,大约有两种方式:第一种是目前推理机制融合方式,这是人工智能目前新的关注点,包括我们在内的一些团队已经将自动推理机制引入加强非语料依赖推理能力;第二种是专业软件输出对象重塑为ChatGPT类的产品,与ChatGPT这类应用相反,大多数流程中的专业化规则化工作已经存在对应的专业软件,这类软件的重新定义重塑输出,可以与ChatGPT比较好配合,一定程度可以跨越这个障碍,我预测这类新的应用或者服务很快就会席卷市场。
第三, ChatGPT的专业适应化。在目前ChatGPT展示的能力中,其专业化能力仍然有所欠缺,例如针对保险较复杂的专业安排等,这需要ChatGPT针对保险业进行微调,这种微调更有可能基于提示学习(Prompt learning),类似于我们已经做的针对医疗和金融的调整。但通过我对New bing的GPT4研究,发现这方面进化极大,或许在GPT4发布之后,这个障碍就自然可解了。
我们再来看内在机制角度,结论是直接的,内在机制决定的ChatGPT能力上限说明其作为工具很难形成产能价值;当然GPT本身机制也会调整,并可以通过解决上述三个障碍来接近逼近上限,但即使如此其单独作为产能工具的条件仍然是不具备的。
结论:ChatGPT为代表的AIGC技术可以为保险业提供从赋能到增能的支持,距离产能还有一段路要走。
三、ChatGPT蕴含的思想对于保险的启示
如果只把ChatGPT看做一种工具,那么在保险公司中应用ChatGPT的能力就够了;但如果把ChatGPT看作一种新的生产方式,我们则应该看到ChatGPT蕴含的思想对保险的影响。
ChatGPT的思想可以从其训练过程以及发布后的公众反应进行总结,大体上可以按照知识经济学可以分为三个层次:
第一个层次是数据要素创造价值的新模式的到来,即以泛数据为代表的、非监督学习/强化学习/模仿学习为主要特征提取方式的模式。该思想来自于ChatGPT的内在机制和公众使用的判断。保险科技的深入已经让保险行业意识到数据作为要素的重要性和地位,并在以监督学习为代表的框架下创造了第一类价值,例如欺诈识别、非标题定价、巨灾模型等等。但ChatGPT使得要素价值创造模式发生了改变,这种改变使得人工智能从弱人工智能迈向通用人工智能——一些人认为是强人工智能的必然阶段。这种思想于保险行业也非常重要,可以预见类似于合规风险、理赔定损、客户服务等业务中可以构建类似的稳定模式,形成新的价值,这一类价值的特点是不以替代人类劳动为目标,而是创造新的价值空间为目标,但由于其自身不能直接构建价值,会需要更多的人类协作,所以,这应该很受员工欢迎——AI是朋友而不是敌人。
第二个层次是增量知识的偏好增长。该思想来自于ChatGPT训练过程。ChatGPT所基于的InstructGPT基于偏好构建奖励模型,并使得后续能力养成过程中泛知识有序增长。这种方法也体现在许多复制GPTf3的模型中(如APO),其产生的较好效果说明其思想的重要性。如果把保险公司产品迭代看作“增量知识“,那么可以说保险公司其实迭代时考虑“偏好”是不足的,渠道所反馈的特征信息收到三重谬误影响:幸存者需求(存量客户)、中介激励限制(代理人激励)以及惯性认知(固有而陈旧的市场需求分析)。现实情况是,在不同层次上,保险公司的“增量知识”与真实的需求偏差很大:公司和客户层面上,以健康险为例,公司看到的是险(保险),客户看到的是健康;在代理人和客户层面上,客户看到的是生命质量需求,代理人看到的是金融产品等等。
第三个层次是需求目标的“第一性“。该思想来自于ChatGPT的推广及应用。它对保险行业发展以及保险公司数字化转型有重要的启示意义,原因在于:保险行业尚未实质性融入到生命质量经济体系中,而生命质量经济是保险的逻辑基础;保险公司数字化转型并没有以构建三流合一机制为目标,而是局限在赋能尺度上做文章。这使得保险公司需要重新审视新的经济特征、新的需求特征以及新的数字要素价值。这里牵涉较多专业而细微的内容,这里从略。
四、AIGC无处不在的世界,保险行业会发生怎样的变化?
随着包括ChatGPT在内的AIGC迅速普及——甚至是光速普及,ChatGPT的能力将无处不在,ChatGPT的思想也不断构建新的可能,我们的世界充满了AIGC所生成的内容、能力和思想。在这样的世界,保险行业会发生怎样的改变?大约有三个变化将会发生:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!