新的可能性于是，他开始了对类ChatGPT的研究，并在短短几个月内完成了第一个版本然而，马新并没有想到，ChatGPT的火爆程度会如此之高，连带着让他也受到

文章主题：中国小康网, 独家专稿, ChatGPT, 自然语言处理

　　中国小康网独家专稿

　　文|《小康》·中国小康网袁凯

　　做ChatGPT好比踢足球，踢足球都是盘带、射门，但是要做到梅西那么好也不容易。

新的可能性于是，他开始了对类ChatGPT的研究，并在短短几个月内完成了第一个版本然而，马新并没有想到，ChatGPT的火爆程度会如此之高，连带着让他也受到

在人工智能领域，有一个基本的原则，那就是算法训练无法轻易地实现“弯道超车”。自从2018年GPT-1第一代生成式预训练模型的问世以来，OpenAI团队用了近6年的时间，通过不懈的努力和研究，最终成功地打造出了现在的大语言模型。这一成果的取得，充分体现了算法训练需要长期积累和不断深化的过程。

ChatGPT作为一种人工智能内容生成技术，能够为人们带来诸多实际应用。首先，它在文案宣传方面具有巨大潜力，能够根据用户需求生成各种不同类型的文案，提高企业的市场曝光度和销售业绩。其次，ChatGPT在智能营销领域也有广泛应用，它能够通过分析用户行为和喜好，为企业量身定制营销策略，提高营销效果。此外，ChatGPT还能帮助企业实现智能风控，通过对大量数据进行分析，及时发现潜在风险，为企业决策提供有力支持。最后，ChatGPT还能协助开发人员编写代码，提高编程效率，缩短项目周期。然而，尽管ChatGPT具有这些优点，但我们也不能忽视其潜在的风险和挑战，比如隐私保护、数据安全等问题，这些问题需要我们在推广应用的同时加以解决。

王志刚，我国科技部部长，近日以踢足球为例，形象地描绘了人工智能助手ChatGPT的技术特点。他指出，虽然足球比赛包含盘带和射门等技巧，但要达到梅西等顶级球员的水平，却并非易事。同样地，ChatGPT作为一款人工智能产品，虽然在技术进步方面取得了显著成果，特别是在确保算法的实时性和质量有效性方面具有突出表现，但要达到行业领先水平，仍需不断努力。

　　复旦 MOSS团队：路还很长

最近，复旦大学计算机科学技术学院的邱锡鹏团队成功研发出了类ChatGPT模型MOSS。消息公布后，这款模型迅速引起了广泛关注，收到了众多内测申请、采访、投资以及合作邀请。这主要是因为ChatGPT的热度很高，导致公众对于这项起初仅限于NLP（自然语言处理）学术领域的新技术产生了极大的兴趣。

在2021年，邱锡鹏团队便已投身于中文生成式预训练领域的探索，成功开发出相关模型并以开源形式供大众下载，平均每月都能获得一万多次的下载。随着研究的不断深化，团队逐渐提出了“语言模型即服务”这一创新理念，将基础语言模型视为提供语言服务的基石。到了2022年，邱锡鹏团队更是专注于训练大型语言模型，经过半年的努力，成功实现了大型语言模型对人类指令的理解以及对话能力的掌握。

在今年春节前的腊月二十八，令邱锡鹏团队欢欣鼓舞的一天，因为他们在常规测试中遇到了一个令人惊喜的结果。项目主开发者的计算机科学技术学院博士研究生孙天祥，在测试过程中输入了一个中文问题，然而MOSS却以英文作出了准确的回答，这就像一个虽然不会说但能听懂中文的人一样。值得一提的是，当时的MOSS版本还处于初级阶段，其训练数据中中文语料的比例不到0.1%，这无疑为团队的后续工作提供了巨大的信心和动力。

真令人惊讶，当MOSS展现出其潜在能力时，邱锡鹏当晚兴奋得难以入眠。他将MOSS视为一个拥有巨大智慧的儿童，尽管目前尚不擅长写诗、解答问题或处理许多具体事务，但已经显露出具备通用人工智能（AGI）巨大潜力的事实。这表明MOSS已经能够理解许多看似遥不可及的事物，并迅速掌握其要领。

在众多人的眼中，ChatGPT、MOSS等大型语言模型与我们的日常语音助手小爱同学、Siri之间似乎并无太大差别。然而，事实真的如此吗？邱锡鹏教授为我们揭示了其中的真相。他以智能手机与功能手机的比喻来解释两者之间的区别。在过去的聊天系统中，我们可以将它们视为弱人工智能的应用，其主要功能就是进行聊天交流，就如同传统功能手机仅能实现打电话的基本功能。然而，如今的大型语言模型，如ChatGPT、MOSS等，它们的性能和功能已经发生了翻天覆地的变化。它们不仅可以进行聊天交流，而且还可以执行诸多其他任务，聊天仅仅是其中的一项功能。正如智能手机除了可以打电话外，还能拍照、上网、听音乐等多重功能，大型语言模型同样具有广泛的应用前景。

　　邱锡鹏也坦言，与ChatGPT相比，MOSS的最大差异还是参数规模。 “ChatGPT的参数量多达1750亿个，而MOSS的参数量比其小一个数量级，大约是前者的1/10左右。” 邱锡鹏团队认为，这个规模在财力物力承受范围之内，也使模型具备一定的智能。实验结果证实了团队的猜想，MOSS模型可以非常顺利地与人类进行聊天互动。邱锡鹏介绍，MOSS的特点是小规模，比较容易适应个性化模型，可以赋予更多专业化能力，利于企业内部私有部署，经过一些数据微调就可以转化为生产力。

　　2月20日，MOSS上线当晚，网站一度瘫痪。邱锡鹏团队在官方回应中表示，MOSS还是一个不太成熟的模型，计算资源不足以支撑庞大的访问量，距离ChatGPT还有很长的路要走。在MOSS完成初步验证之后，团队会将经验、代码、模型参数开源出来供大家参考。中国版ChatGPT的诞生还需要中国全体AI从业者的共同努力，更需要不断和人交互以提高能力。团队也将坚持对最前沿AI模型的不懈追求。

　　AI从业者：一天成本要3亿

　　在国内ChatGPT的追逐赛道上，除了作为重头戏的头部科技公司与专家研究团队，还有不少想要尝鲜ChatGPT的个人，但他们往往无法迈出第一步。

　　“若用ChatGPT的方法，以小冰框架当前支撑的对话交互量计算，每天成本将高达3亿元，一年成本超过1000亿元。” 在来自大洋彼岸的这股科技潮最初传导至国内之时，小冰CEO李笛就为不少想要尝试做国内ChatGPT的人泼了一盆冷水。

　　马新几乎是国内最早接触到ChatGPT那批人。2022年11月30日，ChatGPT发布，5天内涌入100万用户。马新深受触动，开始考虑自己做类ChatGPT的可行性。

　　“我本身从事的是AI行业。ChatGPT拥有持续的上下文对话能力，同时支持文章写作、诗词生成、代码生成等。这让我很是惊讶。”马新知道，这对AI行业是颠覆性的，它不在于技术上的创新，而在于向大众展示了一个全新的使用技术的途径，那就是NLP任务(自然语言处理)中基于大型语言模型(LLM，Large Language Model)演进出的GPT。马新认为，NLP任务(自然语言处理)的核心逻辑是 “猜概率”。“现阶段所有的NLP任务，都不意味着机器真正理解这个世界，他只是在玩文字游戏，进行一次又一次的概率解谜，本质上和我们玩报纸上的填字游戏是一个逻辑。只是我们靠知识和智慧，AI靠概率计算。”这决定了如果没有大量资金支持，AI便无法进行足够的“语言预训练”。正如ChatGPT铺天盖地的宣传里总是离不开这样一句话：在拥有3000亿单词的语料基础上预训练出拥有1750亿参数的模型。“如果说3000亿单词是训练数据，那么1750亿参数就是沉淀下来的AI对这个世界的理解。”了解到训练步骤需要花费的资金后，马新彻底打消了试水ChatGPT的念头。“做中国版ChatGPT是百度、阿里这样的大厂才敢拥有的野心。而其它挂着ChatGPT概念的公司，几乎只能局限在很小的领域，资金不足以支撑语言训练是最大的问题。”

　　而在多位行业人士看来，要做中国ChatGPT，不光是“语言预训练”的问题。与OpenAI相比，国内大厂在算力和算法方面与之同样有差距。高性能GPU是人工智能的基石。去年英伟达高端GPU芯片对中国供应受限，有行业人士算了一笔账：想要训练与ChatGPT相匹敌的大模型，每年在显卡、CPU等设备方面投入的成本高达10亿美元。面对如此庞大的现金流需求，不少人预判，“微软、谷歌这样的硅谷大厂有这个能力，国内大厂有这一实力的也少”。

　　李笛认为，与其说中美两国在人工智能领域有巨大的“技术壁垒”，不如说有一定的“时间壁垒”。“时间壁垒”带来的则是算法方面的差距。一个基础常识是，算法训练是一件没有办法弯道超车的事情。自2018年推出第一代生成式预训练模型GPT-1起，OpenAI用了近6年的时间沉淀出了当前的大语言模型。“这6年的差距没办法用半年的时间实现超越，除非有天才少年用更加完善的算法框架实现降维打击。”

　　其实，不少AI从业人士同样认为，由于人工智能对算力、算法、时间的要求很大，其成本压力太高，因此，AI必须要找到一个明确具体的垂直场景。

　　与其临渊羡鱼，不如退而结网。对于许多国内公司而言，基于ChatGPT的场景赋能应用，或许是新一轮科技军备竞赛中的理性选择。

　　(《小康》·中国小康网独家专稿)

　　本文刊登于《小康》2023年3月下旬刊

举报/反馈

新的可能性于是，他开始了对类ChatGPT的研究，并在短短几个月内完成了第一个版本然而，马新并没有想到，ChatGPT的火爆程度会如此之高，连带着让他也受到

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号AIGC666aigc999或上边扫码，即可拥有个人AI助手！

相关文章