文章主题:
「打造中国OpenAI」,「西湖心辰」这家创立时间不到两年的小公司怎么敢夸下海口?
相比于国内的其他创业团队,心辰具有以下几大优势:
在大模型研究领域,我们的研究和商业化落地比同行提前了一年。我们成功积累了超过百万用户,并训练出了能够与GPT-3.5相媲美的模型——RIO。
蓝振忠,一位杰出的创始人,在Google期间,他负责领导研发了一款具有极高影响力的AI助手——大模型ALBERT(学术引用4300)。这款ALBERT模型在大型语言模型领域取得了卓越的成果,从而使蓝振忠与众多AI领域的杰出人物建立了紧密的合作关系,例如与Transformer论文作者以及Character.ai的创始人Noam Shazeer等。
我们已经成功组建了一个具有高度人才密集度的团队,涵盖了深度学习框架的关键环节,包括架构设计、训练和推理等,这个团队的成员来自于谷歌、元宇宙和亚马逊等知名公司的顶级高管和科研专家。
4.背靠中国的新型研究型大学西湖大学,拥有丰厚的人才储备和强大的算力资源。
在蓝振忠看来,多模态大模型在AI进化演变中是一个必然趋势,这也是西湖心辰想要打造的「中国OpenAI」的目标之一——创造一个可以自助联网的多模态大模型。蓝振忠深知要做成中国OpenAI需要「高举高打」,正在寻觅一位如Sam Altman一样拥有极强的资源整合能力、充满远见且对技术狂热的CEO入局。
作者|李梅 西西
编辑|陈彩娴
无论近日蹭 ChatGPT 热度的讨论有多少,一个客观的行业事实却是:在赶超 OpenAI、打造「中国版 ChatGPT」的决赛圈中,最终能登上光明顶的团队并不多。
大致来说,目前国内追击 ChatGPT 的团队可以分为三类:一类是有人才、有资本的互联网大厂,如百度、京东、字节等;一类是有强大科研实力(尤指能开发语言大模型)的产学研初创团队,如西湖心辰、智谱 AI等;还有一类,则是 ChatGPT 火起来后入局的互联网老兵们,如王慧文、王小川等。(AI科技评论稍后将会推出更详细的派系梳理,敬请关注)
在这篇文章中,我们将探讨三类团队在开发大型语言模型时所必需的基本要素。尽管这些团队各自拥有独特的优势和劣势,但他们都需要满足一些共同的要求。首先,他们必须有足够的资金来支持大量算力的投入,这是研发大型语言模型所必需的。其次,团队中必须有精通算法和工程的熟练研发人员,这样才能训练出性能卓越的语言模型。最后,团队还需要有一支擅长商业落地的职业经理人团队,他们能够整合各种资源,把握市场动态并成功吸引客户。然而,这一点往往被人们忽视。
为什么 OpenAI 能研发出 DALL·E 与 ChatGPT 这样的产品?
OpenAI 的成立宗旨是追求通用人工智能(AGI)的实现。这是一个相对较为专业的术语,但对于普通互联网用户而言,可能并不十分熟悉。然而,随着ChatGPT的出现,所有用户都可以借此机会亲身体验到这种跨越式知识领域的AI系统所带来的影响。它不仅让用户了解到AI的应用范围已经远远超越了像AlphaGo这样的特定领域,同时也打破了人工智能仅限于围棋等特定游戏的界限。
在众多因素中,产品的良好设计创新性显得尤为重要,这不仅彰显了OpenAI团队在设定宏伟目标方面的卓越执行力,也体现出了他们既能够高瞻远瞩,又能够脚踏实地地推进工作的特点。
OpenAI 的成功可以归结于三个关键因素:首先,他们在积极寻求外部资源方面取得了正确的决策,引入了如微软等重要合作伙伴;其次,他们确保了研发团队的独立性和创新精神,使得他们能够在科学研究中采取大胆的策略;最后,他们具备了商业思维的前瞻性,认识到在追求通用人工智能(AGI)的道路上,开发创新产品不仅能够吸引用户,还可以通过强化学习来收集大量的优质数据,从而更好地推动科研进展。
换句话说,在我国追踪ChatGPT的过程中,各类团队都需要具备三个关键要素。对于大型企业所具有的潜力,我们在此不再展开讨论。然而,从初期的科研型AIGC初创团队以及后期专注于商业的二次或连续创业团队来看,他们在起点的劣势也十分明显。前者在商业资源方面存在不足,而后者则缺乏人才和技术积累。
西湖心辰的创始人蓝振忠很早就看到了这个风险点。作为一家由西湖大学孵化的初创企业,西湖心辰正在积极寻找像 OpenAI 的Sam Altman 一样既对技术狂热,又有极强资源整合能力的CEO。
一位有经验的 CEO,对 ChatGPT 类的初创公司意味着什么?又为什么要加入西湖心辰这样的初创公司?
1、独树一帜的「ChatGPT 玩家」
在这波 ChatGPT 的玩家中,西湖心辰是一个独特的团队,其独特之处与它的创始人蓝振忠有密切联系。(此前AI科技评论报道过《ALBERT一作蓝振忠:从谷歌离职回到西湖大学,只为打造一个24小时在线的「心理咨询师」》)
蓝振忠的本科毕业于中山大学,后到卡内基梅隆大学读博,研究方向为计算机视觉与多媒体分析。蓝振忠对人工智能的想象,是像电影《Her》里面的萨曼莎一样,能文能武,掌握文字、语音、图像多个模态的能力,所以立志成为多模态研究者,2018年加入谷歌 AI 的研究与机器智能组从事自然语言处理(NLP)研究。
在谷歌,蓝振忠依托谷歌的 TPU 资源,两个月就训练出了性能媲美 3 亿参数大模型 BERT 的轻量化版本:ALBERT,开拓了 AI 领域内研究轻量化大模型的先例。2020年6月回国、加入西湖大学后,蓝振忠又继续基于大模型开发了辅助心理咨询的聊天机器人「小天」,并创立了西湖心辰。
创始人同时具备语言大模型与视觉模型训练能力的特质,让西湖心辰也从一开始就朝着多模态的产品方向发展。在SD开源之前,心辰就敏锐的判断text2image模型正在脱离实验室的范畴,达到商用级别, 在2022年8月快速推出了AI画图产品「盗梦师」(现已改为「造梦日记」)。
据了解,「造梦日记」目前积累了超过百万 C 端用户,数十家 B 端用户。作为一个次日留存接近 50% 的小程序,造梦日记一方面能在商业上盈利,为西湖心辰研发大模型输血;另一方面,造梦日记与小天一样,像 OpenAI 的逻辑,在与用户的交互中收集了领先行业的高质量数据,反哺了算法的优化。
「造梦日记」优秀画作入选2022卢浮宫国际艺术展国内语言大模型的玩法最先是在学术圈兴起,产学研团队有物理性的客观优势。西湖心辰能在这波 ChatGPT 中紧跟行业步伐,与国内的大小厂竞争,也是因为其有领先其他玩家数年的语言大模型研发基础、商业化产品探索与坚实的科研人才基础。
ChatGPT 还没出来之前,西湖心辰就已经有自研的文本生成产品「Hey Friday」。他们最早在海外推广,有数万用户,去年八月 AIGC 在国内火起来后,他们就开始研发面向国内的文本生成产品,ChatGPT 刚出来没多久,西湖心辰就推出了类 ChatGPT ——「心辰Chat」。
在时间上,心辰Chat 比一批号称「即将推出」的公司快了将近一个月、甚至两个月的时间。相比许多功能未明的种子「中国版 ChatGPT」,心辰Chat 目前更具确定性,抢了先机。
在产品设计上,心辰Chat也做了许多创新:
首先,「心辰Chat」是一个可以自助上网的 AI 系统。我们向它提问新近发生的事件,比如「马斯克什么时候收购了Twitter?」、「美团联合创始人王慧文,最近做了什么?」等等,它都能对答如流。
「心辰Chat」问答示例而 ChatGPT 目前无法访问互联网上的内容,接入Bing搜索之后才能联网,所以对于「马斯克什么时候收购了推特」的提问,它则会根据旧语料给出「马斯克最近并没有收购过推特,推特是一家独立的公司……」这样的回答。
其次,「心辰Chat」是一个多模态对话系统。ChatGPT只具有文本生成的单模态功能,但在与「心辰Chat」的对话中,我们除了能让它写作以外,还可以用它来生成图像。
「心辰Chat」生成图像示例如上图所示,在所生成图像的基础上,用户还可以直接「用嘴修图」,交互方式便捷有趣。
在蓝振忠看来,多模态是一个必然趋势,因为单模态的学习能力有限,比如用户告诉 AI一个颜色词「红」,如果「看不到」红色对应的图像,AI 是无法理解这个词的;类似地,假如只有关于「跑」的文字和图像,AI 也无法获取这个动作的真正含义。
虽然西湖心辰是一家初创公司,但由于创始团队在文本与图像两个模态上均有一定时间的积累,同时避免像谷歌急匆匆推出与 ChatGPT 差异化不大的产品 Bard 引来的反感与抨击,西湖心辰选择追求多模态版的「中国版 ChatGPT」。
西湖心辰有积累,但蓝振忠也看到:作为一个小团队,能否田忌赛马,在国产 ChatGPT 的竞争中冲出重围,西湖心辰还需要更强的武装与策略。
2、西湖心辰的长处与短板
「如果我们今年不打算入局 ChatGPT,我们今年的盈利就已经能覆盖研发投入、实现净利润收入了。」蓝振忠告诉 AI 科技评论。
行业内的一个共识是:AGI 的实现是万里长征,沿途会产生许多能引起小爆点的成果,正如 DALL·E 不会是 OpenAI 的收官之作一样,ChatGPT 之后,OpenAI 也会在原来的基础上推出更强大的产品。AGI 需要长期主义,ChatGPT 的追随也同样如此。
当蓝振忠与团队决定加入打造中国版 ChatGPT 后,他们就意识到,他们需要一位 CEO。
长城非一日建成,AGI 的研究也非一日之功。虽然文字生成神器 ChatGPT 是一个更为具体的目标,但在蓝振忠等玩家的眼中,ChatGPT 只是通往罗马的一个驿站。而就拿这个小小的驿站来说,最终能参与的团队就不会太多。
以语言大模型的研发为例。数据、算法与算力,三者缺一不可。平心而论,西湖心辰在类 ChatGPT 上的科研基础与技术积累已经超过了大多数的 AI 公司。
首先看数据。
ChatGPT 之所以能甩开全球的竞争对手,关键在于数据积累。ChatGPT 一经推出,一周内就收获了百万用户的使用,在初始数据(用户反馈)的积累上对模型不断迭代,强者愈强。但幸运的是,ChatGPT 进不来中国,所以中国的团队还有机会。
目前来看,追击 ChatGPT 的三类中国团队当前都处于起跑线上,大厂、初创企业与资本大鳄的差距都还不算太大。凭借技术积累,西湖心辰这样的小公司是有长板的。
以数据为例。西湖心辰的产品矩阵包含小天、造梦日记、Hey Friday,合计用户量超过 140 万 C 端用户、数十家 B 端用户。早期的数据积累,包括用户咨询、写作、绘画的提示词描述等,能够为心辰Chat提供高质量的数据源泉,这是许多公司所没有的。
其次是算法人才。
ChatGPT 的诞生并非偶然,跟其背后的团队 OpenAI 聚集了一批科研天才有很大关系。
一位博士毕业的行业观察者告诉 AI 科技评论,OpenAI 的成功与其团队的年轻化与理想化分不开。
从个人发展的规律来看,无论国内外,无论有没有「35 岁被裁员」的压力,许多科研人才过了35岁、40岁后,都普遍从一个有理想的科研青年,进入了回归家庭的养老状态。学术界也逃不开「35 岁」的年龄分水岭:由于通过长聘教轨制度考核的难度太大,许多青年教师在拿到终身教职后就会选择躺平。
因此,一个能吸引年轻、有理想的人才的团队,将是决胜 ChatGPT 的关键。而依托高校科研力量、能不断聚集年轻科研人才的团队,在这一点上具有独特优势。
据了解,目前西湖心辰的团队已经有大模型研发的技术积累,比如 RIO模型,是国内最早商业化落地的经过 Instructional Learning 的大模型,其效果已经超越了原版GPT-3。比如造梦日记能做到秒级出图和更强的中文理解,也是心辰团队对于采样函数和模型理解层做了独特的优化的结果。
此外,西湖大学为西湖心辰提供了强大的算力支持。蓝振忠介绍,如果西湖心辰只在图像生成与文本写作上发力,现有的人才资源、客户资源与算力资源是足够的;但在追赶 AGI 与 ChatGPT 这样更大的目标上,西湖心辰需要更多的资源。
算力是重要的壁垒之一。
如上图所示,大模型的研发需要解决诸多问题,左图中从右往左,黄色部分到绿色部分、再到黑色部分,研发环节会越来越底层,难度越大、研发投入也需要更多。目前,大多数的团队都只进行到数据端的数据标注,算法端的监督学习,而 OpenAI 是从数据清洗、自监督学习开始,从底层做起。
日前谷歌推出 Bard 来与微软对战,行业人评价这本质上是 TPU 与 GPU 的对决。而对国内没有 TPU 的团队(包括西湖心辰在内)来说,算力的壁垒会更高。据蓝振忠了解,国内许多公司、甚至大厂,都没有一千张以上的 GPU,那么对西湖心辰这样的创业公司来说自然更难。
对于这个问题,蓝振忠很理性。他认为,要解决资源问题,一要引入更多的资本,二要与大公司合作(如微软与 OpenAI 的模式),三要建立良好的客户联系(包含小 B 端)。而目前,西湖心辰的团队中,包括蓝振忠本人也是一位科学家,更擅长做研究。
因此,西湖心辰需要一位 CEO!
3、寻找「奥特曼」
从造梦日记开始,西湖心辰就进入了许多投资人与行业的眼中。这意味着,西湖心辰将要进入下一个更大的阶段,同时也将面临更大的挑战。
加上越来越多的玩家涌入 ChatGPT,AIGC 往工程化更进一步,蓝振忠知道,寻找一位能高举高打的CEO很关键。他们相信,西湖心辰会是国内最有潜力实现 ChatGPT 的团队之一,但现实的问题也需要脚踏实地去解决。
早在图像生成中,蓝振忠就向AI科技评论表示:「不仅是 AI 画画,事实上文本生成也具备极大的潜力。」
与图像生成相比,文本生成的用户基础展示出了更大的成本优势。
不同于图像生成的用户囿于 B 端、甚至小 B 端,图像生成的使用群体主要是专业人群,场景也有限,而文本生成的应用场景覆盖营销文案写作、邮件写作、办公写作、论文写作、短消息回复等等用途,也更细碎。一个图像生成软件目前在风格与内容泛化上的能力仍较弱,只能与垂直领域结合,但文本生成可以同时提供多项功能服务,任何人都可以使用、也都需要。
因此,虽然语言大模型的投入更大,但当用户足够多,数十亿的成本平摊下来,几乎可以忽略不计,跟高速的建设是一个逻辑。同时,类似插画师的用户群像在使用工具上的能力更强,而文本生成的用户更多是 C 端小用户,后者更愿意依托现有产品,这也给了类似 ChatGPT 这样的文本生成产品提供更大的增值服务空间。
事实上,这也是微软的 CEO 萨特亚对人工智能的理想。自萨特亚接手微软 CEO 后,他认为微软的业务应该依托三个方向的科技投入,而这三大技术则是云计算、人工智能与量子计算。在萨特亚的想象中,我们的生活还远远没有智能化;如果足够智能化,那么一个普通的职工每天就不会花那么多时间在琐碎的办公环节上,比如回复邮件、写工作汇报、写周报日报、订机票等等。
而文本生成,正可以帮助人们的时间从这些琐碎的日常中解放出来。——这也是蓝振忠的科研理念。从研究人工智能开始,他就相信,未来会有《Her》里面的萨曼莎一样的 AI 系统,让每个人都有一个私人助理。
蓝振忠表示,他希望寻找一位能认同该理念、对 AI 能产生的价值潜力有强认同的 CEO。只有发自内心的认同,才能全力以赴。
他指出,Sam Altman 当初引入微软这样的资本大鳄,对 OpenAI 研发出 ChatGPT 是功不可没的关键一步。微软对 OpenAI 有认同,为支持 ChatGPT 的研发,萨特亚曾坚决抵抗内部的反对、甚至绕过 CFO 直接调用原本用于微软内部研发的服务器。
在追求 AGI 的道路上,Sam Altman 不一味坚持技术理想主义,眼光独到、引入微软,平衡了技术发展的需求与商业转化的目标,找到了一条正确的道路帮助 OpenAI 往 AGI 的理想更近一步。随着 ChatGPT 的成功,微软又大笔加注,OpenAI 的科研实力也将肉眼可见地潜力无限。
蓝振忠谈道:回到中国的市场来看,西湖心辰与 OpenAI 在人才与规模上具有许多相同之处。OpenAI 能在谷歌、微软、Facebook 等等大厂云集的美国赛场中突围而出,西湖心辰在国内同样也有机会。
作为一名科学家,蓝振忠很严谨,不画饼。过往的产品打造已经验证了西湖心辰的商业潜力,蓝振忠与团队清楚自己的科技实力,也看到自身管理经验的不足,而合作是共赢的基础。西湖心辰需要 CEO、需要战友,也需要合作伙伴。
ChatGPT 有门槛,有商业价值。西湖心辰麻雀虽小、五脏俱全,加之当前国内风云未定,如果你是一位看好 ChatGPT 的成功创业者,西湖心辰邀请你来当 CEO!
有兴趣的读者欢迎自荐,联系西湖心辰创始人蓝振忠:lanzhenzhong@westlake.edu.cn
更多内容,点击下方关注:
本文来自于微信公众号“AI科技评论”——“聚焦人工智能前沿研究,关注人工智能青年成长。”AI科技评论是专注人工智能(AI)学术和科学前沿的平台,前身是雷锋网的学术频道。欢迎搜索关注微信公众号“AI科技评论”(ID:aitechtalk)了解更多相关报道。AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!