作者:吴辰光、李汭遥
备受瞩目的国产版ChatGPT终于来了。
3月16日,百度发布新一代大语言模型、生成式AI产品文心一言。从现场展示看,文心一言在某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。
但或许有了谷歌仓促应对ChatGPT在演示时出现重大错误的前车之鉴,此次百度没有做现场演示。又或许是在百度发布会的两天前,OpenAI推出升级版ChatGPT-4,再一次将门槛提高,打乱了百度的节奏。总之,与一个月前的高调预热相比,此次发布低调了许多。
百度创始人、董事长兼首席执行官李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。
但不管怎样,大语言模型是无法突击速成的,百度能成为第一个对标ChatGPT的中国科技企业,终究是向前迈出了一步,而如何缩短与OpenAI的差距,将是下一步的看点。
文心一言如约而至
3月16日,百度召开新闻发布会,围绕新一代大语言模型、生成式AI产品文心一言展开。现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。
在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
中文理解方面,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力,文心一言甚至能够生成四川话等方言语音,但视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
李彦宏表示,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。
从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
CHIP奇谱科技总编罗国昭表示,文心一言不如预期但在预料之内,很多人会拿文心一言和ChatGPT-4相比,觉得无论在语言理解能力还是功能特性上都有较大差距,但这是以静态的方式来看待发展中的事物,其实双方都处于快速成长过程中。
在DCCI互联网研究院院长、知名互联网学者刘兴亮看来,文心一言比预期要好一些。虽然和ChatGPT总体上还有差距,但对于中文的理解更好一些。同时,文心一言抢先一步的生成图片功能也是个亮点。
高调预热低姿态发布
与一个月前的高调预热相比,此次发布低调了许多。
2023年伊始,随着微软对OpenAI追加数十亿美元的投资,让ChatGPT在国内刷屏了。百度、阿里、腾讯、华为等大厂纷纷表示自己在大模型领域已展开布局。此后,包括原美团创始人王慧文在内的多位科技圈大佬也纷纷发文宣布打造中国的OpenAI。其中,百度给出的信息是最详细的。
2月7日,百度通过其官方公众号宣布将推出类ChatGPT产品文心一言,引发热议,百度港股股价盘中一度拉高17%。一周内,已有上百家企业宣布将接入文心一言。李彦宏曾表示,中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。
可见,无论是市场还是百度自己,都对文心一言充满信心。但GPT-4的出现或许打乱了百度的节奏。
3月14日,OpenAI正式发布了GPT-4,这个大型多模态模型可以实现强大的识图能力、字数限制提升至2.5万字、回答准确性显著提高、生成歌词、创意文本,实现风格变化等多项飞跃式提升,在各种专业测试和学术基准上表现与人类水平相当。总之,与GPT-3.5相比,GPT-4的能力大幅提升,就像是小学生跨越升级到高中生。
再回到文心一言的发布现场,李彦宏先是打了一剂预防针:“从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。但也不能说我们完全ready了,文心一言要对标ChatGPT、甚至是对标 GPT-4的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。”
在李彦宏看来,是需求推动了文心一言的面世,百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是客户需要,合作伙伴需要。
刘兴亮认为,ChatGPT-4确实给了百度很大的压力,但什么产品都不可能是完美的,新产品总要拉出来溜溜的。现阶段看,文心一言连续对话能力、逻辑推理能力与ChatGPT-4还是有一定差距的。
罗国昭告诉坤舆商业观察,文心一言的上线多少有仓促的因素,但百度的AI能力不用质疑。ChatGPT只是AI的一种模式,并不是全部,而百度的AI之路也不是从文心一言开始的。AI不仅是语言的理解能力,更依赖于其他多维模式,如图形、视频等。“AIGC好不好看、回答尴尬不尴尬,有相当成分的主观因素。对于技术的脉络,大家并无差距。”
未来仍有机会
一个插曲是,在文心一言发布后,百度股价经历下跌和大幅反弹,这表明市场对文心一言的技术能力、使用体验、商业化前景等维度存在巨大分歧,亦导致公司股价大幅波动。
中信证券认为,作为首次亮相的语言大模型,在模型微调、体验反馈、优化落地等方面仍需强化,同时参考海外经验,语言大模型从预训练完成到实际发布落地,亦需经过1-2个季度的优化与升级。而百度此次亦在生态合作伙伴中进行内部测试,通过测试实现产品的迭代与升级。
自2月份以来,已有超过650家企业宣布接入文心一言生态,未来预计会有更多企业进行申请参与。
中信证券预计,文心一言在短期仍将聚焦迭代升级。随着经济的持续复苏,百度的核心业务有望逐季度改善,并对当前公司估值形成支撑,后续AI模型的升级优化亦将带来估值弹性。维持百度的“买入”评级。
实际上,百度积累的优势不是一朝一夕可以完成。在过去的10年里,百度在AI的研发投入超1000亿元。
李彦宏指出,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,无法速成。
人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层到“芯片-框架-模型-应用”四层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。
李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了 4D 混合并行技术。
在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,这是百度独特的优势。后续,芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,从而升级用户体验。
虽然目前还无法与ChatGPT相提并论,但百度毕竟是目前国内第一个对标ChatGPT的企业,未来一段时间内,在其他国内大厂没有进一步动作的情况下,百度仍肩负着国产ChatGPT的崛起重任。
“整体上要追上ChatGPT,个人觉得挺难的。因为你跑别人也在跑,ChatGPT作为先行者用户量越大数据越多,用户参与打分的行为越大,对于后来者来说,追赶的难度就越大。”刘兴亮说道,“但百度不是没有机会,如果说ChatGPT-4是目前的综合冠军,那百度可以在个别领域去争单项冠军。”
罗国昭认为,相比英文语料已经非常好的结构化,中文语料有着明显的差异。用发展的眼光看,在中文的环境里,本土的百度更具优势。同时,对这种产品来说,个人使用是小打小闹,更多的要看行业应用的可能性,行业应用可以快速导入商业应用。真正的AI能力既是企业的核心竞争力,也是国家的战略竞争力,这个是非常大的一个前景。
“目前OpenAI也处于初步的商业化过程中,百度有机会。ChatGPT-4是个学霸,文心一言则是晚出生一点的学霸。”罗国昭说道。