文章主题:ChatGPT, 大模型, 西湖心辰
「打造中国OpenAI」,「西湖心辰」这家创立时间不到两年的小公司怎么敢夸下海口?
相比于国内的其他创业团队,心辰具有以下几大优势:
🌟【大模型研究与商业化进程】🚀🎉 一步领先,步步领先!我们专注于探索超大规模语言模型的发展,比行业平均提前了一年,引领潮流,为未来的智能应用奠定坚实基础。🌍🏆 独特之处在于,我们的技术已积累百万级用户,这不仅是量的积累,更是质的飞跃。用户反馈与数据驱动,使得我们的RIO模型在性能上堪比GPT3.5,智慧光芒闪耀!💡🔍 商业化的脚步稳健而坚定,我们不仅有强大的技术实力,更有对用户体验的深刻理解。让技术真正服务于大众,让创新成果惠及每一个角落。🌍🌟 SEO优化提示:使用行业热门关键词如”大模型商业化”、”用户积累”和”GPT3.5匹敌”,同时融入情感色彩和未来展望,提升文章吸引力和搜索引擎排名。
🌟【行业巨擘】🌟蓝振忠,曾任Google资深架构师,引领创新,以ALBERT(4300学术引用)一鸣惊人,大模型领域权威人士。与AI界巨头如Transformer之父Noam Shazeer及Character.ai创始人交情深厚,共同推动技术革新。他的专业背景和丰富经验,无疑为行业注入了强大的驱动力。🌟
🌟🌟🌟【打造精英团队】🌟🌟🌟我们荣幸地建立起一支熠熠生辉的人才矩阵,涵盖了从大模型架构到训练、推理各核心领域,集结了行业巨头的重量级人才。这其中包括来自Google、Meta与Amazon等科技巨擘的高管与科研专家,他们以深厚的专业素养和丰富经验,为团队注入强大的创新动力。🌟SEO优化词汇:高才集群、关键环节深度覆盖、全球顶尖精英汇聚 gözlem yaparak, bu ekibin kritik alanlarda uzmanlık ve deneyim sayesinde, iş süreçlerinin hızlanmasına ve yüksek kalitede sonuçlar elde edilmesine katkıda bulunuyor. 🚀
4.背靠中国的新型研究型大学西湖大学,拥有丰厚的人才储备和强大的算力资源。
在蓝振忠看来,多模态大模型在AI进化演变中是一个必然趋势,这也是西湖心辰想要打造的「中国OpenAI」的目标之一——创造一个可以自助联网的多模态大模型。蓝振忠深知要做成中国OpenAI需要「高举高打」,正在寻觅一位如Sam Altman一样拥有极强的资源整合能力、充满远见且对技术狂热的CEO入局。
作者|李梅 西西
编辑|陈彩娴
无论近日蹭 ChatGPT 热度的讨论有多少,一个客观的行业事实却是:在赶超 OpenAI、打造「中国版 ChatGPT」的决赛圈中,最终能登上光明顶的团队并不多。
大致来说,目前国内追击 ChatGPT 的团队可以分为三类:一类是有人才、有资本的互联网大厂,如百度、京东、字节等;一类是有强大科研实力(尤指能开发语言大模型)的产学研初创团队,如西湖心辰、智谱 AI等;还有一类,则是 ChatGPT 火起来后入局的互联网老兵们,如王慧文、王小川等。(AI科技评论稍后将会推出更详细的派系梳理,敬请关注)
🌟了解团队动态,首先要明确三大要素:💰充足的资金支持,以驱动大规模语言模型的创新计算;📚顶尖算法与工程专家,训练出性能超群的语言巨擘;💼商业实战型管理团队,整合资源,洞悉市场,连接客户。虽各有优缺点,但这些核心能力是所有成功团队的共通秘诀,往往被轻易忽视。🚀
为什么 OpenAI 能研发出 DALL·E 与 ChatGPT 这样的产品?
🌟【探索未来AI】🚀OpenAI的初心,是引领我们步入通用人工智能(AGI)的世界,虽然这个概念可能稍显抽象,但ChatGPT正以实际行动赋予它生动意义。🎉每个互联网用户只需与ChatGPT一“聊”,就能亲身体验到AI的强大——跨越知识领域的智能系统,让AI不再是单一技能如AlphaGo的棋手。🌐ChatGPT的崛起,就像一道闪电,瞬间点亮了大众对AI的认知,让我们看到科技的力量如何打破界限,连接无限可能。🌍它不仅改变了我们与机器互动的方式,更揭示了AI的广泛适用性和深度潜力。🔍欲了解更多关于AGI和AI的深入理解,不妨跟随ChatGPT的脚步,一起探索这个充满惊喜与未来的领域。📚别忘了,每一次交流都是对智能科技的一次深度学习!🎓
🌟OpenAI团队的卓越执行力体现在他们对创新产品的独到见解上,这不仅体现了他们的远见卓识,也让实际行动落地生根。他们的设计思维,就像星辰与大地的完美交汇,既闪耀着科技的光芒,又深深植根于用户体验之中。🚀
OpenAI 做对了三件事:一是积极对外争取资源,引入了像微软这样的巨头;二是保持了研发团队的创新独立性,敢于激进地科研;三是具有沿途下蛋的商业思维,在追随 AGI 的道路上,开发创新产品,既能吸引用户,又能通过强化学习的方式收集大量优质数据,反哺科研。
换言之,国内的三类团队在追击 ChatGPT 的过程中,也要具备这三要素。大厂的潜力暂不评论,但偏科研的 AIGC 初创团队与偏商业的二次/连续创业团队,在起点上的劣势则显而易见,前者缺商业资源能力,后者缺人才与技术积累。
西湖心辰的创始人蓝振忠很早就看到了这个风险点。作为一家由西湖大学孵化的初创企业,西湖心辰正在积极寻找像 OpenAI 的Sam Altman 一样既对技术狂热,又有极强资源整合能力的CEO。
一位有经验的 CEO,对 ChatGPT 类的初创公司意味着什么?又为什么要加入西湖心辰这样的初创公司?
1、独树一帜的「ChatGPT 玩家」
在这波 ChatGPT 的玩家中,西湖心辰是一个独特的团队,其独特之处与它的创始人蓝振忠有密切联系。(此前AI科技评论报道过《ALBERT一作蓝振忠:从谷歌离职回到西湖大学,只为打造一个24小时在线的「心理咨询师」》)
蓝振忠的本科毕业于中山大学,后到卡内基梅隆大学读博,研究方向为计算机视觉与多媒体分析。蓝振忠对人工智能的想象,是像电影《Her》里面的萨曼莎一样,能文能武,掌握文字、语音、图像多个模态的能力,所以立志成为多模态研究者,2018年加入谷歌 AI 的研究与机器智能组从事自然语言处理(NLP)研究。
在谷歌,蓝振忠依托谷歌的 TPU 资源,两个月就训练出了性能媲美 3 亿参数大模型 BERT 的轻量化版本:ALBERT,开拓了 AI 领域内研究轻量化大模型的先例。2020年6月回国、加入西湖大学后,蓝振忠又继续基于大模型开发了辅助心理咨询的聊天机器人「小天」,并创立了西湖心辰。
创始人同时具备语言大模型与视觉模型训练能力的特质,让西湖心辰也从一开始就朝着多模态的产品方向发展。在SD开源之前,心辰就敏锐的判断text2image模型正在脱离实验室的范畴,达到商用级别, 在2022年8月快速推出了AI画图产品「盗梦师」(现已改为「造梦日记」)。
据了解,「造梦日记」目前积累了超过百万 C 端用户,数十家 B 端用户。作为一个次日留存接近 50% 的小程序,造梦日记一方面能在商业上盈利,为西湖心辰研发大模型输血;另一方面,造梦日记与小天一样,像 OpenAI 的逻辑,在与用户的交互中收集了领先行业的高质量数据,反哺了算法的优化。
「造梦日记」优秀画作入选2022卢浮宫国际艺术展国内语言大模型的玩法最先是在学术圈兴起,产学研团队有物理性的客观优势。西湖心辰能在这波 ChatGPT 中紧跟行业步伐,与国内的大小厂竞争,也是因为其有领先其他玩家数年的语言大模型研发基础、商业化产品探索与坚实的科研人才基础。
ChatGPT 还没出来之前,西湖心辰就已经有自研的文本生成产品「Hey Friday」。他们最早在海外推广,有数万用户,去年八月 AIGC 在国内火起来后,他们就开始研发面向国内的文本生成产品,ChatGPT 刚出来没多久,西湖心辰就推出了类 ChatGPT ——「心辰Chat」。
在时间上,心辰Chat 比一批号称「即将推出」的公司快了将近一个月、甚至两个月的时间。相比许多功能未明的种子「中国版 ChatGPT」,心辰Chat 目前更具确定性,抢了先机。
在产品设计上,心辰Chat也做了许多创新:
首先,「心辰Chat」是一个可以自助上网的 AI 系统。我们向它提问新近发生的事件,比如「马斯克什么时候收购了Twitter?」、「美团联合创始人王慧文,最近做了什么?」等等,它都能对答如流。
「心辰Chat」问答示例而 ChatGPT 目前无法访问互联网上的内容,接入Bing搜索之后才能联网,所以对于「马斯克什么时候收购了推特」的提问,它则会根据旧语料给出「马斯克最近并没有收购过推特,推特是一家独立的公司……」这样的回答。
其次,「心辰Chat」是一个多模态对话系统。ChatGPT只具有文本生成的单模态功能,但在与「心辰Chat」的对话中,我们除了能让它写作以外,还可以用它来生成图像。
「心辰Chat」生成图像示例如上图所示,在所生成图像的基础上,用户还可以直接「用嘴修图」,交互方式便捷有趣。
在蓝振忠看来,多模态是一个必然趋势,因为单模态的学习能力有限,比如用户告诉 AI一个颜色词「红」,如果「看不到」红色对应的图像,AI 是无法理解这个词的;类似地,假如只有关于「跑」的文字和图像,AI 也无法获取这个动作的真正含义。
虽然西湖心辰是一家初创公司,但由于创始团队在文本与图像两个模态上均有一定时间的积累,同时避免像谷歌急匆匆推出与 ChatGPT 差异化不大的产品 Bard 引来的反感与抨击,西湖心辰选择追求多模态版的「中国版 ChatGPT」。
西湖心辰有积累,但蓝振忠也看到:作为一个小团队,能否田忌赛马,在国产 ChatGPT 的竞争中冲出重围,西湖心辰还需要更强的武装与策略。
2、西湖心辰的长处与短板
「如果我们今年不打算入局 ChatGPT,我们今年的盈利就已经能覆盖研发投入、实现净利润收入了。」蓝振忠告诉 AI 科技评论。
行业内的一个共识是:AGI 的实现是万里长征,沿途会产生许多能引起小爆点的成果,正如 DALL·E 不会是 OpenAI 的收官之作一样,ChatGPT 之后,OpenAI 也会在原来的基础上推出更强大的产品。AGI 需要长期主义,ChatGPT 的追随也同样如此。
当蓝振忠与团队决定加入打造中国版 ChatGPT 后,他们就意识到,他们需要一位 CEO。
长城非一日建成,AGI 的研究也非一日之功。虽然文字生成神器 ChatGPT 是一个更为具体的目标,但在蓝振忠等玩家的眼中,ChatGPT 只是通往罗马的一个驿站。而就拿这个小小的驿站来说,最终能参与的团队就不会太多。
以语言大模型的研发为例。数据、算法与算力,三者缺一不可。平心而论,西湖心辰在类 ChatGPT 上的科研基础与技术积累已经超过了大多数的 AI 公司。
首先看数据。
ChatGPT 之所以能甩开全球的竞争对手,关键在于数据积累。ChatGPT 一经推出,一周内就收获了百万用户的使用,在初始数据(用户反馈)的积累上对模型不断迭代,强者愈强。但幸运的是,ChatGPT 进不来中国,所以中国的团队还有机会。
目前来看,追击 ChatGPT 的三类中国团队当前都处于起跑线上,大厂、初创企业与资本大鳄的差距都还不算太大。凭借技术积累,西湖心辰这样的小公司是有长板的。
以数据为例。西湖心辰的产品矩阵包含小天、造梦日记、Hey Friday,合计用户量超过 140 万 C 端用户、数十家 B 端用户。早期的数据积累,包括用户咨询、写作、绘画的提示词描述等,能够为心辰Chat提供高质量的数据源泉,这是许多公司所没有的。
其次是算法人才。
ChatGPT 的诞生并非偶然,跟其背后的团队 OpenAI 聚集了一批科研天才有很大关系。
一位博士毕业的行业观察者告诉 AI 科技评论,OpenAI 的成功与其团队的年轻化与理想化分不开。
从个人发展的规律来看,无论国内外,无论有没有「35 岁被裁员」的压力,许多科研人才过了35岁、40岁后,都普遍从一个有理想的科研青年,进入了回归家庭的养老状态。学术界也逃不开「35 岁」的年龄分水岭:由于通过长聘教轨制度考核的难度太大,许多青年教师在拿到终身教职后就会选择躺平。
因此,一个能吸引年轻、有理想的人才的团队,将是决胜 ChatGPT 的关键。而依托高校科研力量、能不断聚集年轻科研人才的团队,在这一点上具有独特优势。
据了解,目前西湖心辰的团队已经有大模型研发的技术积累,比如 RIO模型,是国内最早商业化落地的经过 Instructional Learning 的大模型,其效果已经超越了原版GPT-3。比如造梦日记能做到秒级出图和更强的中文理解,也是心辰团队对于采样函数和模型理解层做了独特的优化的结果。
此外,西湖大学为西湖心辰提供了强大的算力支持。蓝振忠介绍,如果西湖心辰只在图像生成与文本写作上发力,现有的人才资源、客户资源与算力资源是足够的;但在追赶 AGI 与 ChatGPT 这样更大的目标上,西湖心辰需要更多的资源。
算力是重要的壁垒之一。
如上图所示,大模型的研发需要解决诸多问题,左图中从右往左,黄色部分到绿色部分、再到黑色部分,研发环节会越来越底层,难度越大、研发投入也需要更多。目前,大多数的团队都只进行到数据端的数据标注,算法端的监督学习,而 OpenAI 是从数据清洗、自监督学习开始,从底层做起。
日前谷歌推出 Bard 来与微软对战,行业人评价这本质上是 TPU 与 GPU 的对决。而对国内没有 TPU 的团队(包括西湖心辰在内)来说,算力的壁垒会更高。据蓝振忠了解,国内许多公司、甚至大厂,都没有一千张以上的 GPU,那么对西湖心辰这样的创业公司来说自然更难。
对于这个问题,蓝振忠很理性。他认为,要解决资源问题,一要引入更多的资本,二要与大公司合作(如微软与 OpenAI 的模式),三要建立良好的客户联系(包含小 B 端)。而目前,西湖心辰的团队中,包括蓝振忠本人也是一位科学家,更擅长做研究。
因此,西湖心辰需要一位 CEO!
3、寻找「奥特曼」
从造梦日记开始,西湖心辰就进入了许多投资人与行业的眼中。这意味着,西湖心辰将要进入下一个更大的阶段,同时也将面临更大的挑战。
加上越来越多的玩家涌入 ChatGPT,AIGC 往工程化更进一步,蓝振忠知道,寻找一位能高举高打的CEO很关键。他们相信,西湖心辰会是国内最有潜力实现 ChatGPT 的团队之一,但现实的问题也需要脚踏实地去解决。
早在图像生成中,蓝振忠就向AI科技评论表示:「不仅是 AI 画画,事实上文本生成也具备极大的潜力。」
与图像生成相比,文本生成的用户基础展示出了更大的成本优势。
不同于图像生成的用户囿于 B 端、甚至小 B 端,图像生成的使用群体主要是专业人群,场景也有限,而文本生成的应用场景覆盖营销文案写作、邮件写作、办公写作、论文写作、短消息回复等等用途,也更细碎。一个图像生成软件目前在风格与内容泛化上的能力仍较弱,只能与垂直领域结合,但文本生成可以同时提供多项功能服务,任何人都可以使用、也都需要。
因此,虽然语言大模型的投入更大,但当用户足够多,数十亿的成本平摊下来,几乎可以忽略不计,跟高速的建设是一个逻辑。同时,类似插画师的用户群像在使用工具上的能力更强,而文本生成的用户更多是 C 端小用户,后者更愿意依托现有产品,这也给了类似 ChatGPT 这样的文本生成产品提供更大的增值服务空间。
事实上,这也是微软的 CEO 萨特亚对人工智能的理想。自萨特亚接手微软 CEO 后,他认为微软的业务应该依托三个方向的科技投入,而这三大技术则是云计算、人工智能与量子计算。在萨特亚的想象中,我们的生活还远远没有智能化;如果足够智能化,那么一个普通的职工每天就不会花那么多时间在琐碎的办公环节上,比如回复邮件、写工作汇报、写周报日报、订机票等等。
而文本生成,正可以帮助人们的时间从这些琐碎的日常中解放出来。——这也是蓝振忠的科研理念。从研究人工智能开始,他就相信,未来会有《Her》里面的萨曼莎一样的 AI 系统,让每个人都有一个私人助理。
蓝振忠表示,他希望寻找一位能认同该理念、对 AI 能产生的价值潜力有强认同的 CEO。只有发自内心的认同,才能全力以赴。
他指出,Sam Altman 当初引入微软这样的资本大鳄,对 OpenAI 研发出 ChatGPT 是功不可没的关键一步。微软对 OpenAI 有认同,为支持 ChatGPT 的研发,萨特亚曾坚决抵抗内部的反对、甚至绕过 CFO 直接调用原本用于微软内部研发的服务器。
在追求 AGI 的道路上,Sam Altman 不一味坚持技术理想主义,眼光独到、引入微软,平衡了技术发展的需求与商业转化的目标,找到了一条正确的道路帮助 OpenAI 往 AGI 的理想更近一步。随着 ChatGPT 的成功,微软又大笔加注,OpenAI 的科研实力也将肉眼可见地潜力无限。
蓝振忠谈道:回到中国的市场来看,西湖心辰与 OpenAI 在人才与规模上具有许多相同之处。OpenAI 能在谷歌、微软、Facebook 等等大厂云集的美国赛场中突围而出,西湖心辰在国内同样也有机会。
作为一名科学家,蓝振忠很严谨,不画饼。过往的产品打造已经验证了西湖心辰的商业潜力,蓝振忠与团队清楚自己的科技实力,也看到自身管理经验的不足,而合作是共赢的基础。西湖心辰需要 CEO、需要战友,也需要合作伙伴。
ChatGPT 有门槛,有商业价值。西湖心辰麻雀虽小、五脏俱全,加之当前国内风云未定,如果你是一位看好 ChatGPT 的成功创业者,西湖心辰邀请你来当 CEO!
有兴趣的读者欢迎自荐,联系西湖心辰创始人蓝振忠:lanzhenzhong@westlake.edu.cn
更多内容,点击下方关注:
本文来自于微信公众号“AI科技评论”——“聚焦人工智能前沿研究,关注人工智能青年成长。”AI科技评论是专注人工智能(AI)学术和科学前沿的平台,前身是雷锋网的学术频道。欢迎搜索关注微信公众号“AI科技评论”(ID:aitechtalk)了解更多相关报道。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!