文章主题:ChatGPT, 问题分析, 应用展望, 俄乌战争
ChatGPT实践问题分析与应用展望
图片来源@视觉中国
文 | 零点有数科技
ChatGPT是OpenAI最新的语言模型,与其他大型语言模型一样,能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。目前来看,ChatGPT在很多领域都有广泛的应用前景,但任何工具的应用都是有前提的,了解其背后的工作机制和局限之处,才能更好地利用这项技术。
01 ChatGPT概述
ChatGPT是OpenAI最新的语言模型,较其前身GPT-3有大幅提高。与其他大型语言模型一样,ChatGPT能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。作为OpenAI最新一代的大型语言模型,ChatGPT的设计非常注重交互性。为了调优ChatGPT,OpenAI使用了监督学习和强化学习的组合,其中强化学习的组件使其独一无二。OpenAI使用了“人类反馈强化学习”(RLHF)的训练方法,该方法在训练过程中利用人类反馈,以最小化无用、失真或有偏见的输出。
目前来看,ChatGPT在很多领域都有广泛的应用前景,并且它的操作简单,对用户非常友好。但任何工具的应用都是有前提的,了解其背后的工作机制和局限之处,才能更好地利用这项技术,零点有数数据科学家将基于此谈谈ChatGPT在应用时需要注意的几个方面。
02 ChatGPT的局限之处
多场景问题一是标注数据。诸如回答内容存在事实性错误,对于确定的事实,其给出的答案无法达到高置信度,对于常识性的知识问题不能高效地给出符合日常认知的答案。大模型训练所需语料涉及面非常广,仅就人文学科而言,就存在非常庞杂的知识的语料,因此,在标注过程中,相关任务对标注人员的知识面、逻辑思考能力等都有极高的要求。在此基础上,还需要针对更多语料中提及的知识进行自动抽取,反复校验,才可一步步改进。如下图,关于古诗《登鹳雀楼》的提问,ChatGPT未能给出符合常识的回答,包括古诗的原文和作者信息。
二是数据理解。对于简单的数据说明可以顺利地进行比较分析,但面对略复杂的语义理解要求回答比较困难,对于中文丰富的词汇体系、语法和句法的特点,特别是涉及近义词之间的差别和近义程度的区分,还需要补充更多更广泛的训练数据、做进一步的训练和优化,才能修正相应问题。示例如下图。
三是数据分析能力。由于数据理解和分析能力暂未完善,ChatGPT目前无法正确有效地进行数理逻辑计算。如下图所示,针对四人四天喝四桶水,八人八天喝多少桶水的数据计算问题,并没有一次性形成合理的计算逻辑链路,给出正确的计算结果。
答复的生成内容不具备实时性
知识库信息未能实时更新。由于ChatGPT目前的版本仅支持2021年之前的语料信息提问,其回答的内容没有进行实时信息关联。训练一个模型的人力成本较大、时间周期较长,短期内难以有效地更新学习即时性的知识信息。
自2022年2月俄乌战争爆发以来,我们注意到ChatGPT所依赖的最新训练数据仅涵盖至2020年。因此,对于随后的战争发展及其相关事件,该模型将无法提供具有时效性的详细情况分析。尽管ChatGPT具备广泛的能力和较高的模型复杂度、丰富性和通用性,但在某些专业领域方向上,其对资深知识信息结构的理解仍有待进一步提升。
在之前的对话中,ChatGPT仅提供了网络通信中信息增益率公式的概述性解释,但并未明确地展示公式的符合化表示和详细的解释说明。
03 ChatGPT场景应用问题
ChatGPT 的广泛应用虽然在许多领域中都展现出了其强大的能力,但也带来了一些需要我们关注的问题。首先,在教育教学的领域中,ChatGPT 的出现使得学生在学习过程中过于依赖机器获取知识和解答,这不仅削弱了学生自身的思考能力,也使得他们无法得到有效的实践锻炼,从而影响了他们的知识掌握能力和问题解决能力的提升。此外,ChatGPT 在论文写作领域的应用,也容易导致学生产生过度依赖,进一步削弱他们的创新能力。其次,在公共安全领域,ChatGPT 的应用也存在一定的风险。例如,它可以模仿不同人员的对话习惯,结合语音合成功能,实现高仿真的人类交流和互动。如果这些功能被应用于诈骗等不法行为中,可能会助长违法犯罪活动,影响社会的稳定。同时,由于 ChatGPT 模型训练所使用的大量的可公开数据和知识,可能存在数据泄露的风险,尤其是涉及到国家安全、商业机密和个人隐私等敏感数据。最后,在伦理道德层面上,ChatGPT 的应用也需要我们引起足够的重视。虽然 ChatGPT 是一种人工智能助手,但其行为和回答仍然可能产生误导,甚至误导人们的行为和决策,可能对社会风范和道德观念产生不良影响。因此,我们需要对 ChatGPT 的应用进行合理的规范和管理,避免其对社会产生负面的影响。
在伦理道德层面上,个人、社会和国家都受到相应的影响。对于未成年人以及许多成年人来说,由于他们的心智尚未成熟且稳定,因此在使用ChatGPT时,他们的个人观点容易受到直接或间接的影响,从而导致不适当的行为。此外,从社会和国家的视角来看,ChatGPT若被视为文化冲击的工具,可能会对社会和国家产生负面影响。
以上这些方面,都亟待相关技术方在技术层面对相关内容进行完善,对各种使用方进行权限的控制和监控,同时相关职能部门应从国家层面进行立法,进行合理的限制和管控。
04 关于ChatGPT算法的拓展构想
站在数据智能垂直应用的角度上,零点有数数据科学家基于丰富的业务经验,从以下四个方面谈了关于ChatGPT算法的拓展构想:
一是行业训练数据优势。ChatGPT还需要进一步整合各行业历史沉淀数据,并将数据转换为高质量、有效的训练数据集,才能更好地提升行业应用模型的精度。
二是提升推理能力。通过对业务场景的理解,针对未知业务场景进行从规则、向量表示推理至 prompt 的多层范式学习推理过程。
三是实施动态的线上更新机制。这个机制能够实时地收集并分析线上数据,然后根据分析结果进行模式化的更新。这样的更新过程不仅能够将最新的信息及时地反馈到模型中,而且还能够持续地对模型进行调整和优化,从而形成一个有效的模型训练与学习机制,保证模型的准确性和适应性。
四是合理挖掘发现行业应用场景。通过更深层次地将GPT技术与垂直行业的业务做融合,构建行业化的GPT模型,并服务于业务实际需求。(本文首发钛媒体APP)返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!