文章主题:ChatGPT, 问题分析, 应用展望, 俄乌战争
ChatGPT实践问题分析与应用展望
图片来源@视觉中国
文 | 零点有数科技
ChatGPT是OpenAI最新的语言模型,与其他大型语言模型一样,能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。目前来看,ChatGPT在很多领域都有广泛的应用前景,但任何工具的应用都是有前提的,了解其背后的工作机制和局限之处,才能更好地利用这项技术。
01 ChatGPT概述
ChatGPT是OpenAI最新的语言模型,较其前身GPT-3有大幅提高。与其他大型语言模型一样,ChatGPT能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。作为OpenAI最新一代的大型语言模型,ChatGPT的设计非常注重交互性。为了调优ChatGPT,OpenAI使用了监督学习和强化学习的组合,其中强化学习的组件使其独一无二。OpenAI使用了“人类反馈强化学习”(RLHF)的训练方法,该方法在训练过程中利用人类反馈,以最小化无用、失真或有偏见的输出。
目前来看,ChatGPT在很多领域都有广泛的应用前景,并且它的操作简单,对用户非常友好。但任何工具的应用都是有前提的,了解其背后的工作机制和局限之处,才能更好地利用这项技术,零点有数数据科学家将基于此谈谈ChatGPT在应用时需要注意的几个方面。
02 ChatGPT的局限之处
多场景问题一是标注数据。诸如回答内容存在事实性错误,对于确定的事实,其给出的答案无法达到高置信度,对于常识性的知识问题不能高效地给出符合日常认知的答案。大模型训练所需语料涉及面非常广,仅就人文学科而言,就存在非常庞杂的知识的语料,因此,在标注过程中,相关任务对标注人员的知识面、逻辑思考能力等都有极高的要求。在此基础上,还需要针对更多语料中提及的知识进行自动抽取,反复校验,才可一步步改进。如下图,关于古诗《登鹳雀楼》的提问,ChatGPT未能给出符合常识的回答,包括古诗的原文和作者信息。
二是数据理解。对于简单的数据说明可以顺利地进行比较分析,但面对略复杂的语义理解要求回答比较困难,对于中文丰富的词汇体系、语法和句法的特点,特别是涉及近义词之间的差别和近义程度的区分,还需要补充更多更广泛的训练数据、做进一步的训练和优化,才能修正相应问题。示例如下图。
三是数据分析能力。由于数据理解和分析能力暂未完善,ChatGPT目前无法正确有效地进行数理逻辑计算。如下图所示,针对四人四天喝四桶水,八人八天喝多少桶水的数据计算问题,并没有一次性形成合理的计算逻辑链路,给出正确的计算结果。
答复的生成内容不具备实时性
知识库信息未能实时更新。由于ChatGPT目前的版本仅支持2021年之前的语料信息提问,其回答的内容没有进行实时信息关联。训练一个模型的人力成本较大、时间周期较长,短期内难以有效地更新学习即时性的知识信息。
自2022年2月俄乌战争爆发以来,我们注意到ChatGPT所依赖的最新训练数据仅涵盖至2020年。这意味着,对于随后的战争发展及其相关事件,该模型将难以提供具有时效性的情况分析。尽管ChatGPT具备广泛的能力,但在专业深度方面仍有提升的空间。模型在复杂度、丰富性和通用性方面的表现相当出色,然而,在某些特定专业领域方向上,对资深知识信息结构的认知仍存在优化余地。
在之前的对话中,ChatGPT仅提供了网络通信中信息增益率公式的概述性解释,但并未明确地展示公式的适应性表示和详细解读。
03 ChatGPT场景应用问题
ChatGPT 的广泛应用虽然在许多领域中都展现出了其强大的能力,但也带来了一些需要我们关注的问题。首先,在教育教学的领域中,ChatGPT 的出现使得学生在学习过程中过于依赖直接获取答案,这不仅影响了学生对知识的深入理解和掌握,而且也无法有效地培养他们的解决问题的能力,甚至可能导致过度依赖,从而影响学生的创新能力和教育的发展。其次,在公共安全领域,ChatGPT 的应用也存在一定的风险。例如,它可以模仿不同人员的对话习惯,并结合语音合成功能,实现高仿真的人类交流和互动。如果这些功能被应用于诈骗等场合,可能会助长违法犯罪行为,影响社会的稳定。此外,由于 ChatGPT 模型训练所使用的大量的可公开数据和知识可能包含一些敏感数据,因此基于现有的技术研发数据管理体制,可能无法保证这些敏感数据或者通过公开数据研究所得的敏感数据不被泄露。最后,在伦理道德的层面上,ChatGPT 的应用也可能引发一些争议。由于其可以生成相关内容和直接查询,可能会导致信息的准确性受到影响,从而误导人们的行为。同时,ChatGPT 的应用也可能引发一些隐私问题,因为其可以通过模拟人类交流和互动来获取人们的私人信息。综上所述,虽然 ChatGPT 在许多领域的应用都展现出了其强大的能力,但也存在一些需要我们关注的问题,包括对教育教学的影响、公共安全领域的风险以及伦理道德层面的问题。因此,我们需要在推广和应用 ChatGPT 的同时,也要注意这些问题,并采取相应的措施加以解决。
在伦理道德层面上,个人、社会和国家都受到相应的影响。对于未成年人以及许多成年人来说,由于他们心智尚未成熟且稳定,因此在使用ChatGPT时,他们的个人观点容易受到直接或间接的影响,从而导致不适当的行为。此外,从社会和国家的视角来看,如果ChatGPT被用作文化冲击的工具,可能会对社会和国家产生负面影响。
以上这些方面,都亟待相关技术方在技术层面对相关内容进行完善,对各种使用方进行权限的控制和监控,同时相关职能部门应从国家层面进行立法,进行合理的限制和管控。
04 关于ChatGPT算法的拓展构想
站在数据智能垂直应用的角度上,零点有数数据科学家基于丰富的业务经验,从以下四个方面谈了关于ChatGPT算法的拓展构想:
一是行业训练数据优势。ChatGPT还需要进一步整合各行业历史沉淀数据,并将数据转换为高质量、有效的训练数据集,才能更好地提升行业应用模型的精度。
要提高推理能力,我们需要深入了解业务场景,并利用这些知识对未知业务场景进行推理。为此,我们可以采用一种基于规则和向量表示的多层次学习推理过程,从业务场景中提取有用的信息,并通过Prompt生成相应的结果。这种方法可以帮助我们更好地理解和解决复杂的问题,从而提高我们的推理能力。
三是实施动态的线上更新机制。通过实时收集网络数据,并进行有规律的模式化更新,将更新后的信息迅速反馈到模型中,从而构建一个能够长期进行自我反馈和学习的模型机制。
四是合理挖掘发现行业应用场景。通过更深层次地将GPT技术与垂直行业的业务做融合,构建行业化的GPT模型,并服务于业务实际需求。(本文首发钛媒体APP)返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!