ChatGPT背后的技术演进与新一代AI应用前景

文章主题：AI大模型, ChatGPT, 自然语言处理, 人工智能

来源：IT桔子

来源：华兴资本

自 ChatGPT 问世以来，人工智能领域再次成为热点，其中 AI 大模型作为一种具有颠覆性的新技术，引领了新一轮的高潮。众多知名企业及创业团队纷纷投身于这个领域，吸引了广泛的关注和市场的热烈欢迎。

狂欢背后的真相是AI技术的飞跃,它直接创造了生产力,甚至被视为新的生产力革命。如何理解ChatGPT这样的现象级产品背后的技术进步?围绕新一代AI和产业链,又有哪些领先的应用场景和投资机会呢?随着AI技术的不断发展,我们已经看到了许多显著的成果。其中,ChatGPT是一个典型的例子,它的出现改变了人们与机器之间的交互方式,使得自然语言处理更加智能化和人性化。这种技术进步不仅带来了更好的用户体验,也为整个产业带来了巨大的变革。新一代AI技术不仅仅局限于语言处理,还包括图像、语音、机器人等多个领域。这些技术的应用场景非常广泛,例如自动驾驶、智能家居、医疗健康等。在这些领域中,我们已经可以看到许多应用场景的落地,比如自动驾驶汽车已经在一些地区开始商业化运营,智能家居也在逐渐普及。除了应用场景外,新一代AI技术还带来了许多投资机遇。对于投资者来说,他们需要关注的是技术的发展趋势和未来的市场潜力。在这个领域中,一些具有潜力的公司已经开始布局,比如谷歌、亚马逊、微软等科技巨头。AI技术的不断进步和应用场景的逐步拓展,将会带来更多的商业机会和创新。对于投资者来说,把握这个领域的机遇是非常重要的。我们需要持续关注这个领域的最新动态和技术进展,以便及时抓住投资机遇。

近期，华兴新经济基金科技与企业服务团队深度剖析了ChatGPT的发展轨迹和技术理念，重点关注了生成式AI技术的突破和创新路径，同时对其未来在核心应用场景和产业链中的潜在机遇进行了深入思考。团队将这些研究成果整理成本文，希望为广大读者带来一些有益的启示和收获。

ChatGPT是由美国人工智能研究机构Open AI于2022年11月底推出的一个人工智能聊天机器人程序。仅仅40天后，该程序的月活跃用户数量便突破了千万大关，而在上线60天后，其月活用户数量更是一举突破亿级，增长速度堪称同类型产品的翘楚，创造了历史新高。

ChatGPT是一款不断成熟的AI产品，它融合了大模型（Transformer）技术和基于人类反馈的强化学习。这种结合使得使用大规模数据来训练模型成为可能，从而实现了模型的社会化。以GPT为例，AI行业步入了一个新的发展阶段。这个背后的技术变革主要体现在模型技术、参数、训练数据以及训练方法等方面的演进和融合。

生成式AI与上一代AI的核心区别来自于以下几个维度：

Transformer架构的出现，为大参数模型的研发提供了可能。2017年，谷歌公司推出了Transformer模型，它采用并行化的语言处理方法，极大地提高了并行计算的效率。基于Transformer模型的基础上，Open AI于2018年首次提出了GPT模型。该模型能在无监督的情况下进行训练，并在大数据环境中显著提升模型性能。这标志着NLP（自然语言处理）正式进入预训练时代。

在大规模数据的训练过程中，模型参数的提升会引发模型的涌现现象。对于语言模型（LLM）而言，其模型效果的关键因素在于训练数据量以及数据质量，其中训练数据的数据质量甚至超过了参数的作用。为了达到最优效果，我们需要不断地尝试训练数据的清洗和模型参数的调整等方法。这些努力最终目的都是为了提高模型的涌现能力。到了2022年1月，随着思维链（一种提示词方法，不仅能给出结果，还能展示出计算过程）的引入，模型的性能有了显著的提升，远远超过了小模型的精调效果。这意味着大模型研发的路线已经来到了一个转折点。

在训练方法的整合与优化过程中，以ChatGPT为例，我们可以看到RLHF方法的引入发挥了重要作用。首先，这种方法可以有效地 align GPT的输出，使其拥有更为人性化、友好的语言逻辑，从而为其奠定与公众沟通的基础，并确保其符合监管规定，避免陷入与前一代聊天机器人泰依同样的困境。其次，人工反馈的加入也有助于模型更深入地理解人类的思考和意图。综合来看，LLM的演变与提升并非源于单一的技术或训练方法，而是通过不断尝试和整合多种模型技术与训练方法的过程，这需要时间的沉淀和积累。

大模型具备高的算力门槛、创造力门槛、工程化门槛等，使得其必然是高举高打的。从行业终局上看，大模型的终局会类似云，但考虑到不同的技术路线，会比云略分散，预期市场将有4-5家通用大模型公司，其中1-2家可能属于创业公司的机会。

同时，市场会出现几十亿-百亿级参数级别的服务于特定场景的所谓vertical的模型。考虑到更快的落地速度、更低的使用成本以及不亚于大模型的使用效果，叠加更好产品交互体验，vertical的模型会凭借自己在特定场景的深耕而有自己的一方市场。

大模型是有边界的：大模型类似于以往操作系统的存在，其发展起来的核心就要铸造自己的生态，生态的繁荣才是其稳固且长期的壁垒。所以我们看到了Open AI与微软的结合是一个双赢，且是对双方都有极大放大效应的组合。为了生态的繁荣，大模型一定有自己的不可为，同时，大模型的能力也是有边界的。其本质是语言模型，对于规模导向、资源导向、产品体验导向的领域，都不是未来迭代和发展的关键，也不是其能力所在。

大模型生态下的软件和应用：LLM的发展本质带来的是人与软件的的交互形式发生了根本性的改变，所以从浅层来说，软件公司需要思考的是在这个基础上如何让软件的使用门槛更低，而更深层次需要思考的是，未来工作流会不会发生变革，而带来Best Practice的变革，但基于新一代AI的infra的机会是确定的。

基于此，我们简要梳理了四个基础模型的筛选标准：

主流benchmark任务表现：包括其在主流的机器学习任务上的表现（与当下特定任务下表现最好的模型做比较）；跨多模态/跨多语言的的能力、参数量/训练数据质量等作为参照。

技术路线：虽然GPT的decoder-only暂时看起来热度最高，但我们依然保持开放度，关注其他transformer变体的模型。

创始人：有工程化经验的创始团队。大模型本质是摸着石头过河，有实际经历的团队在效率和潜在的成本上会有极大优势。

综合实力：融资能力强+其选择的战略伙伴。

因为底层大模型兼具数据壁垒和算力壁垒，对资金/算力要求高，且具备优势的公司可建立起用户调用和模型迭代之间的飞轮，预计头部玩家较为集中。而目前国内市场格局仍还较为初期和分散，参与大模型的公司已超过30家，未来市场将面临洗牌。

而应用层的落地，发展路径可能会不太一样。这主要在于应用层可基于行业Know-how及数据对模型进一步优化，新一代AI对人类思维理解能力跃升，而行业知识则可以使AI更具备行业专深的能力。打一个形象的比喻，上一代AI模型如果是中学生，这一代大模型即是一个具备通识教育的本科生，应用层要做的就是专才的研究生。伴随专业知识输入和行业Know-how输入，AI可应对复杂度更高，且专业性也更强的工作任务，并能基于行业知识完成融会贯通。

目前在应用侧，生成式AI在文本领域、图像领域、代码领域的应用已经初步成熟，而视频/3D/游戏领域的成熟应用仍需要一定的发展时间。

以文字生成为例，上一代AI能力以辅助功能为主，如文字纠错、转写等，但核心价值还是由人创造。新一代AIGC自动生成部分专业内容，核心是基于对上下文理解后的结构化写作，类似于由辅助驾驶逐步走向自动驾驶，实现对业内初级专业人员的替代，如其可根据用户需求完成对简单专业材料的书写，如突发新闻、网络自媒体稿件等，乃至标书制作、招股书等各类有结构化规律的文书工作均可部分涉足，从而为文字作者、翻译人员、插画创作者、配音人员、音乐制作人、视频编辑人员等提供增效。

目前，借助大模型在细分场景内完成深耕，海外已有相关独角兽公司，我们看到如Jasper、Midjourney、Stability.AI等公司都在快速发展。而针对现有的各类软件，也均有接入新一代AI能力，如Notion AI、Office Copilot、Github Copilot等，我们预计AI落地将同时对新场景和老场景下的软件带来深远影响。

在应用侧，新一代AI对现有应用层软件也将带来影响。一方面，新一代AI对偏管理属性或行业知识属性的赋能效果更明显：此类软件的核心价值在于提供基于行业Know-how或管理Best Practice的知识凝结，现在借助能力更强的AI功能可使软件功能流转更为智能。新一代大模型公司可完成AI功能的搭建，但无法短期快速积累行业Know-how或管理实践，AI更多作为赋能者提升此类软件的实际使用效果。

我们预期，对于具备行业数据+工作流能力的积累的软件服务场景，在AI模型上完成Fine-Tuning，结合垂直行业知识+模型调优，可进一步在专业场景内使用，新一代AI的加入将大幅加强软件的智能性。

另一方面，新一代AI可能对纯工具类软件具有负面影响。无Know-how或数据沉淀下的工具软件的壁垒在大模型面前相对较低，特别是以上一代NLP技术为核心优势的公司，其技术能力被相对拉齐，后续需尽快拥抱新一代技术。

综上，在应用端，我们主要关注文字/图像/代码三个模态领域首先落地，新场景下关注结构化内容生成叠加高价值人力场景，可实现降本增效效果的机会；老场景下关注有潜力完成专有数据丰富积累+垂直行业Know-how积累的公司，推动公司后续跑起用户-数据-效果的飞轮。

本文由华兴资本集团（连同其关联公司，统称“华兴资本”）编写，谨供接收方作参考用途，不构成对接收方的投资建议，不构成买卖、认购证券或其它金融工具及产品的邀请或保证，不作为也不应被视为在任何地区对任何证券的研究报告或任何基金募集文件或对基金投资人的任何信息披露文件。接收方不应仅依靠本文，而应按照自己的判断作出投资决定，并在作出任何投资行动前，咨询专业意见。

本文所载资料的来源皆被华兴资本认为可靠，但华兴资本概不担保本文所含信息的准确性、完整性或新近度。本文所载的见解、分析、预测、推断和期望均截至本文的发表日期，且可能在未经事先通知的情况下调整。华兴资本与本文所提及的公司之间可能存在或寻求业务关系，因此，接收方请知悉可能存在的影响本文客观性的利益冲突。华兴资本不对因使用本文而承受的直接或间接损失承担任何责任。未经华兴资本的事先书面同意，本文件或其任何内容不得被披露或用作其他任何目的。

ChatGPT背后的技术演进与新一代AI应用前景

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

AIGC ChatGPT 创作本科禁止

相关文章