文章主题:华为, 盘古大模型, AI大模型, NLP大模型

666AI工具大全,助力做AI时代先行者!

风口之下,华为盘古大模型与其他“类ChatGPT”产品究竟有何不同?

目前,AI大模型热潮仍在持续,国内众多科技企业正通过各种途径发展。其中,百度集团(BIDU.NASDAQ,09888.HK)已经率先推出了我国首个类ChatGPT产品——文心一言,展示了其对未来人工智能技术的布局和信心。与此同时,阿里巴巴(BABA.NYSE,09988.HK)亦动作迅速,其类ChatGPT产品通义千问,也将在近期开展外部测试,以验证其在实际应用中的表现。这充分体现了两家企业在人工智能领域的前瞻性和领导力。

据市场传闻,华为公司也将参与大型人工智能模型的竞赛,并计划推出名为“盘古系列AI大模型”的产品。然而,时代周报的记者在华为云官方网站上并未找到相关消息,且向华为云的相关人员咨询“盘古系列AI大模型”的上线时间也没有得到明确的回复。

在4月8日的人工智能大模型技术高峰论坛上,华为云首席科学家田奇发表了一次引人瞩目的演讲。尽管这次演讲中,田奇没有公开关于盘古大模型的最新进展和产品策略,也没有披露更多关于NLP大模型的信息,但是他所提到的模型却被公认为是目前最接近人类中文理解能力的AI大模型。

华为云盘古大模型的发展,正在推动人工智能从“作坊式”的开发模式向“工业化”的升级转变,这一点得到了田奇的确认。当前,华为已经逐步发布的矿山、气象、海浪等多个行业的盘古大模型,显示出了这一趋势。对于未来,人工智能在工业领域的应用被广泛认为是人工智能的新爆发点,这无疑让人对华为云盘古大模型的未来发展充满期待。

华为盘古大模型:类ChatGPT产品的不同之处图源:田奇演讲PPT

随着大型科技公司的纷纷加入,各行各业开始广泛应用大模型所提供的AI能力,这标志着一场大规模的技术革新正在悄然兴起,一个新的产业风口正在逐渐形成。在这个风口的背后,华为的盘古大模型与其他类似ChatGPT的产品之间存在着怎样的差异,成为了人们关注的焦点。

拆解盘古大模型

在今年的博鳌亚洲论坛2023年年会上,田奇发表演讲称,“AI for Industries”有望成为人工智能领域的新热点。然而,他的这一观点并未给人们带来全新的启发,因为他的演讲内容缺乏创新性。

备受瞩目的盘古NLP大模型,其背后所涉及的技术领域,正与近期走红的ChatGPT、文心一言、通义千问等模型不谋而合,然而具体细节方面,田奇并未过多透露。

在本次会议上,田奇仅简要概括了华为盘古在NLP大模型领域的布局。当前,该技术已成功应用于文本生成与内容理解,并涉足智能文档搜索、智能ERP以及小语种大模型等领域。此外,华为盘古的技术还成功落地企业财务异常检测及阿拉伯语大模型等实际应用场景。

市场对盘古新NLP模型的期待,来自于这一模型此前的突出表现。资料显示,2019年的权威中文语言理解测评基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项的排名均为第一,总排行榜得分83.046,接近85.61的人类水平。

上海证券分析师陈宇哲在研报中称,在早前的华为开发者大会上,华为曾宣布盘古大模型是业界首个千亿级生成与理解中文的NLP大模型,其认为未来有望成为国内最强的Chat GPT应用。

演讲的后半段,田奇重点介绍了盘古CV大模型和科学计算大模型,以及它们的应用场景。比如,CV领域的矿山大模型、基于盘古CV大模型的铁路巡检方案等,以及科学领域的盘古气象大模型、药物分子大模型、海浪预测大模型。

其中,盘古矿山大模型通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业;华为云盘古气象大模型,可实现20公里范围内、小时级、13层最高精度气象预报,如台风生成时间与移动硅基的预测准确率达85%以上;华为云盘古药物分子大模型,让先导药的研发周期从数年缩短至1个月,同时降低70%的研发成本。

浙商证券分析师陈杭撰写研报表示,在ChatGPT背后,不断迭代的GPT系列使得大模型成为当下科技企业核心竞争力的重要体现,未来,大模型将成为AIGC时代的核心支撑。华为作为国内科技龙头,2021年发布的盘古大模型有望在AIGC时代中引领潮流。

大模型洗牌提速

加入华为之前,田奇已经是AI领域业界知名的学者。2020年3月,田奇加入华为云后便开始组建团队并进行方向梳理;9月,团队开始推动盘古大模型的立项,希望能够在华为云的产业基座上,完成适配各个产业AI开发的大模型;11月,盘古大模型在华为云内部立项成功,并完成与合作伙伴、高校的合作搭建。

据媒体报道,支撑盘古大模型不断攻坚克难的团队,起初仅有几个人,他们是让盘古大模型得以从实验室走向产业的中坚力量。随后,团队逐渐壮大起来,拥有20多名博士、30多名工程师、3名广受关注的“华为天才少年”,还有50多名来自全国C9高校的专家。

要打造一个属于中文世界,并且适配各种真实产业场景的AI预训练大模型,摆在研发团队面前的是两大门槛。

华为盘古大模型:类ChatGPT产品的不同之处图源:图虫创意

一个是技术门槛,大模型需要卓越的并行优化来确保工作效率,这对网络架构设计能力提出了更高的要求;第二是资源门槛,大模型训练需要极大的算力,在训练千亿参数的盘古大模型时,团队调用了超过2000块的昇腾910,进行了超过2个月的训练。

2021年4月,盘古大模型正式对外发布。盘古大模型发布以来,已经发展出L0、L1、L2三大阶段的成熟体系持续进化。

所谓L0,是指NLP大模型、CV大模型等五大水平领域的基础大模型;而L1指行业大模型,比如气象、矿山、电力等行;L2指面向各行业中细分场景的模型,比如电力行业的无人机巡检。

去年9月,华为轮值董事长胡厚崑在2022世界人工智能大会上表示,华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成“基础大模型-行业大模型-细分场景大模型”的发展路径,并且在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效。

如今,随着华为、百度、阿里、腾讯(00700.HK)等科技企业陆续推出相应产品,以及商汤科技(00020.HK)、科大讯飞(002230.SZ)宣布发布计划,大模型赛道将进一步拥挤,市场普遍认为,未来大模型市场势必将迎来新一轮的整合与洗牌。

田奇也在分享中提到,未来“大模型将成为应对AI领域应用碎片化的一种方式,相较于此前不同场景对应不同小模型的状况,未来大模型有可能收编高度定制化的小模型,导致市场向大公司集中”。

华为盘古大模型:类ChatGPT产品的不同之处

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!