文章主题:ChatGPT, 联想集团, AI新范式, 大模型
近期,我国知名科技公司联想集团的CTO兼高级副总裁芮勇博士,针对当前热门的ChatGPT话题,接受了中国计算机学会通讯(CCCF)的独家专访。在访谈中,芮勇博士深入剖析了ChatGPT这类大型模型的前景,并展望了联想集团在AI新范式下的发展战略。他表示,联想的新IT架构将持续推动智能化变革进程,并在其中扮演重要角色。除基础设施外,联想还在积极探讨AIGC技术在产品与业务领域的应用可能性。
从大模型到AGI还有多远?
ChatGPT 是 OpenAI GPT 系列中针对对话场景进行优化的一款语言模型,它被归类为 Foundation Models,也就是基础模型,也被称为“大模型”。根据芮勇的总结,ChatGPT 的主要特点可以概括为“一大三多”:首先,它的参数规模非常大,达到了千亿参数级别,这使得它成为一款超大型的人工智能模型;其次,它采用了多种数据源、多种数据模式以及多种任务来进行训练,这使得它在处理各种对话场景时具有更强的泛化能力;最后,它还利用了互联网规模海量数据进行训练,进一步提升了其性能和效率。
芮勇指出,大模型在内容理解领域取得了显著的突破,如BERT诞生之时,它刷新了11项自然语言理解任务的成绩单。如今,这些大模型又年在内容生成领域取得了令人瞩目的成果,即AIGC。
原内容表达了人工智能领域中的一个重要观点,即大模型的出现是否催生了新的AI范式。对此,芮勇的回答简洁明了:AI范式的演变过程,可以概括为从“针对特定任务的模型微调”(small models fine-tuning)转变为“根据上下文提示自动理解和执行各种任务,而无需调整模型参数或架构”(large models in-context learning)。这样的变化不仅带来了更高效的处理各种任务的方式,也标志着AI技术的发展进入了一个新的阶段。
ChatGPT的崛起,让人们看到了大型语言模型向通用人工智能(AGI)迈进的希望。然而,芮勇教授对大型模型能够走多远以及前景如何仍然持保留态度。他还指出,当前仍有许多争议,关于大型模型是否能够实现“多任务、多模态、多化身”的一体化。
他进一步阐述,近年来大模型取得了显著突破,引发了许多人的乐观预期。根据Gartner技术成熟度曲线,大模型目前正处于“期望膨胀阶段”。人们对大模型的期望之高,也意味着它所承受的压力同样巨大。以谷歌推出的 ChatGPT 为例,尽管其名字叫 Bard,但在首次公开亮相时就出现了回答不准确的问题,导致公司市值在一日之间下跌超过 1000 亿美元。更令人担忧的是,对话机器人生成的句子缺乏可追溯性,甚至包含有偏见和冒犯性的言论。这表明,实现通用人工智能(AGI)的目标仍然任重道远。
联想在大模型普及中发挥怎样的作用?
大模型的兴起,为进行智能化变革的企业带来了很多新的机遇。芮勇以联想为例进行了介绍。联想借鉴大模型背后的基础性算法,将小样本学习应用到基于计算机视觉的产品缺陷检测当中,提升了质检系统对新产品和新产线的快速迁移能力;此外,联想还将强化学习技术和人机协作的理念应用到供应链优化当中,使得供应链在剧烈变化的环境中,不断提升韧性。
对于联想将在AI新范式和大模型普及中发挥怎样的作用,芮勇表示,长远来看,很有可能AI新范式(large models + in-context learning)与旧范式(small models + fine-tune)共存,或是相互结合,而不会单个范式一统天下。联想将充分发挥“端-边-云-网-智”新IT架构的优势,来支撑新旧范式的结合与转换。联想提出的新IT架构,既致力于推动自身的智能化变革,也着眼于赋能各行各业的智能化转型。AI模型对运行环境需求越来越高,例如云-边-端的高度协同,异构计算与负载均衡、设备之间的互联互通、数据安全与隐私保护、模型本身的伸缩性与扩展性等等。联想在这些方面都有着深厚的技术积累,新IT架构在AI新范式加速智能化变革的过程中也会继续发挥重要作用。
除了基础架构之外,联想还在考虑AIGC技术在产品和业务里的应用。比如,在智能设备中对跨模态的生成模型进行优化和裁剪,使之能加载到手机或平板上实现个性化内容生成。在智能解决方案方面,我们考虑把AIGC用于新产品营销与新客户触达。目前,大模型还没有与知识有效结合,我们正在研究数据驱动与知识驱动相结合的方法,即Hybrid Learning来改进大模型的不足。另外,在大模型落地过程中,也需要彻底解决对环境变化或是新领域、新任务的自适应问题,即Adaptive Learning,这些都是联想人工智能的探索方向。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!