大数据文摘授权转载自湃客工坊
作者:itsukun
设计:itsukun
编辑:张铃媛
OpenAI 公司成为了时代的焦点,一时间,国内模仿者众。模仿者的口吻,无非是从“如何复刻一个 ChatGPT”这个命题切入的。有人认为,需要有钱、需要有资本、需要有能够训练 GPT 大模型的硬件;也有人认为,需要有一个好制度,能够实现 OpenAI + 微软式的“产研协同模式”。畅谈理念的同时,还有的人早已行动。一名美团联合创始人,拿出 5000 万美元,筹划了一个估值 2 亿美元的公司,并正在招募中国 AI“梦之队”。数百名百度公司的员工舍弃春节假期,日以继夜工作,总算在 3 月 16 日上线了“文心一言”。不论模仿者是谁,脚踏实地,产出对标 ChatGPT 应用的第一步,便是找到合适的技术人员,结成能解决问题的团队,花费时间模仿。于是,近期许多科技公司正争先恐后地从国外招募 AI 专家回国,尤其是 OpenAI 的员工,来帮助他们打造自己的 ChatGPT。直接挖硅谷华人工程师,复刻 ChatGPT,可行吗?据“量子光年”报道,春节之后,国内类 ChatGPT 项目正高歌猛进,大厂私下里挖人的 AI 人才战,也在如火如荼地打响。有从业经验 8 年的猎头接受采访时说,国内第一、二梯队的互联网大厂客户们诉求只有一条:“就想找 OpenAI 项目里的华人”,且“薪资不设限,越快越好”。“猎”来当事人,得到 ChatGPT 的一手经验,就可以开发出类 ChatGPT 的应用。这无非是一种走捷径的思路。但 OpenAI 团队里的华人,真的愿意回国吗?笔者统计了参与 ChatGPT 以及 GPT-4 项目里华人或中国工程师的人数。ChatGPT 项目中,一共有 9 人;而 GPT-4 项目中一共有 33 人。33 名华人和中国人中,从名字、学术与工作背景上来看,约有 12 人来自于清华、北大、复旦等国内顶尖院校,大多数人赴美深造或在大公司历练后,最终进入了 OpenAI 担任研发。在他们当中,有一位叫做 Twinkle 的 25 岁年轻工程师。Twinkle 本科毕业于清华,喜欢分享。在 ChatGPT 上线第二天,他跑到知乎论坛上,分享了自己亲历 ChatGPT 研发全过程的感想。每隔半年,他会在自己的博客里,写一篇“半年度人生总结”。2022 年上半年,他在“人生总结”里详细地透露了选择去 OpenAI 的经过。作为 2022 级应届毕业生,毕业前他手上握着许多 Offer,其中不乏 Google 这样的大厂邀请。在选择公司时,他自述道:“列了很多 metrics(指标),来衡量一个 Offer 的优劣:钱&税、地点、安全系数、工作方向、个人成长、身份、升职间隔、公司盈利模式与股票上限、工作时间、午休、工作环境与氛围、绩效考核、开源项目、生活成本、天气、吃喝玩乐。”用这种现实主义的思路,来衡量他自己的去向后,他着重强调了自己指标中的两个因素:前景与钱景。他透露道,Meta 公司的 AI 研究部门(FAIR)的职位最适合他的职业发展方向,因为该部门“搞开源项目多且产出成果有影响力”。但 OpenAI 的工作年薪总包(Total Compensation)高达 50 万美元,是他所有 Offer 中给的最多的。他最终选择了 OpenAI。实际上,他也考虑过回国,国内的 AI 量化投资研究公司也向他抛出了橄榄枝。他认为薪水很可观,但顾虑到“政策稳定性和职业发展受限”,便没有接受。实际上 Twinkle 的故事,很能代表加入 OpenAI 的一部分顶级人才的心路历程。很多人放弃大厂和学术界加入 OpenAI,原因不外乎是前景和钱景问题。华盛顿大学的博士应届毕业生 Rowan Zellers,在 2022 年 7 月加入 OpenAI。他拒绝了所有的学术界机会,原因是在学术界做开创性的 AI 系统研究越来越难,不仅缺少物质资源,还缺少工程技术。他在博客里撰文写道:学术界以产出论文获得资助的激励结构,并不适合 AI 系统这种高成本、高风险的系统建设研究。OpenAI 有“足够的资源,正确的激励结构以及良好的环境。”OpenAI 提供的一切条件,不但能够吸引顶级的应届毕业生入伙,还能招徕到各路 AI 界的“神仙”。2 月 23 日,软件即服务公司 Lead genious 和社交网络平台 Punks& Pinstripes 对 736 名 OpenAI 员工的背景进行了分析,发现几乎所有的 OpenAI 核心人才都来自大厂。其中有 59 人之前就职于谷歌,其次是 Meta(34 人)、苹果(15 人)、Dropbox(14 人)、亚马逊(11 人)。这些人为何要离开大厂?原因或许和大厂内部的职场环境有关。谷歌 AI 部门 Google Brain 的两名前员工,接受科技媒体 The Information 采访时,认为公司文化已经“变得令人昏昏欲睡”。报道称,工作人员列举了谷歌层层繁文缛节和对新产品举措的过度保守,导致一些尖端人才正在私下到处找机会。Twinkle 在博客中谈到了这个问题,谈及为何不选择 Google 那样的大厂时,他认为那没有前途,会变成二线应对繁杂业务的“CRUD boy”(在大公司很少涉及原创研发,专注于维护现有产品的科技员工)荒废人生。因此想“开辟下新的赛道能让其他人去 CRUD”。而谈到 OpenAI 的工作环境,接受知乎日报采访时,他的语调明快而又兴奋:“OpenAI 的工作氛围比较轻松,首先公司人少,管理很扁平化。人少就意味着沟通的效率提高了,大家可以很直接地进行沟通,内部都是透明公开的,而且很少开会。如果公司人很多的话,各种政治斗争,各种潜规则就会很麻烦。“OpenAI 给与员工的自由度相对来说也很高,没有很多条条框框的限制,也不会强迫员工去做一些不情愿的工作,你可以做一些自己想做的事情,甚至于工作时间、工作时长、工作节奏都可以由员工自己安排。“工作量还是很大的,我个人还是经常加班的。其实公司方面并不会给工作施加压力,不过一方面是心里过意不去,另一个方面是大家都很热爱这件事情,觉得这个事情能够做成,很有信心,希望把这件事情做好,所以选择主动加班。”从 OpenAI 离职的人,都追求些什么?实际上在近几年来,不是没有工程师离开 OpenAI。但要想让这些顶级工程师离开,就得让他们产生更大的信念与愿景。2020 年 12 月,OpenAI 一批早期核心员工集体离职。当时,相关人员保持了几个月时间的缄默。直到 2021 年 3 月,这批 OpenAI 前核心员工宣布了他们的计划:他们创办了一家叫做 Anthropic 的新公司,以解决长久以来神经网络模型的“黑盒子”问题,为研究者们开发能够解释 AI 真正工作原理的工具。从公司初创理念上来看,这家公司提出了比 OpenAI 更高的要求。这家公司的许多工程师认为,OpenAI 尚未解决偏见和安全问题,就把 GPT-3 开发成了商用化的 API,提供给行业里的大公司使用。他们希望重拾 OpenAI 正在慢慢忘却的“初心”,构建安全至上的开源 AI 大模型。今年 1 月,该公司发布了对新聊天机器人 Claude 的测试,并开放邀请注册。该机器人在 3 月 15 日正式面向 C 端(消费端),试图与 ChatGPT 竞争。但有了第一名,对第二名的关注自然就少。目前国内外舆论场上对 Claude 的关注,远不及 ChatGPT。虽然从融资总额的角度来看,Anthropic 现在被远远甩在 OpenAI 后面,但它远远超过美国生成式 AI 赛道上“第三梯队”的初创企业,自己单独成了一个“第二梯队”。该公司成立之初,就在 A 轮融资中筹集了 1.24 亿美元,2022 年又获得了 5.8 亿美元的 B 轮融资,今年年初又从谷歌和 Spark Capital 各获得了 3 亿美元的投资。目前团队共 80 人左右的 Anthropic,融资额超过 13 亿美元,最新估值 44 亿美元。事实上很早开始,国外就已瞄准 OpenAI 及一众生成式 AI 开发初创企业。在 2021 年,针对国外初创 AI 企业的投资额,相比 2020 年提高了 5 倍多。2021-2022 年,除了 Anthropic,在生成式 AI 赛道上的初创企业,如 Hugging Face、Jasper 等,融到了钱,极大地提升了估值。ChatGPT 众多的竞品,带来的是整个行业的活力,并带来了更多的创新可能性。这些企业开发的下个聊天机器人,并不会仅是复制 ChatGPT,而是在更完美的路上又进一步。或许下一个 OpenAI 的颠覆者,就在这些有着崇高愿景并且愿意“反叛”的初创公司之中。成为引领者,需要研究人员怎样的内在素质?OpenAI 的成功,以及美国目前在生成式 AI 行业的景气情况,归根到底,来源于技术人员的创造力和独特品质。这些技术人员身上,究竟潜藏着怎样的创新“密码”呢?从 Twinkle 的人生记录里,笔者发现了他身上或许有 OpenAI 想要的东西。首先,Twinkle 的性格里有“反叛”精神,“反叛”精神推动了他在人生十字路口,做出了一个个选择。Twinkle 在博客里,一直强调自己有逆反心理。他叙述了自己在大学时“印象最深的,非常激动地去做一件事情的体验”,是“干坏事就特别激动。每次‘黑’进别人网站搞进去了就满满成就感,然后通知网站管理员去修”。他觉得清华的学生总是“人云亦云”,“缺乏职业规划,一路跑着跑着,跑到终点就不知道该干啥了,十分悲哀。”他曾在读博还是读硕的问题上纠结过。最终他的“叛逆精神”以及对自我的认真反思,让他意识到了他自己并不适合科研,并“想做一些真正有影响力的工作”。其次,他在技术行业里初衷的确是为更多人服务,让更多人受益。大四的下学期,他开发了开源项目“天授”与退学网。“天授”项目是 Twinkle 的毕业设计,简单来说,是一个便利他人进行深度学习开发的“AI 基础设施”;而退学网是爬取收集美国使馆签证的预约情况和时间的实时信息平台,以方便留学生进行美国留学签证的申请。在开源网站 GitHub 上,天授至今收获了 5000 多个 Star(点赞);而退学网在 2020 年上半年收获了 200 万访问量。他总结这两个人生作品时,认为:“如果当一个码农的话,最大的成就莫过于自己写的代码被更多的人、更多的系统使用。这也是开源社区生生不息的原因之一。”OpenAI 选择了 Twinkle,或许是因为 OpenAI 也的确是一家想要“反叛”,有着“初心”的公司。OpenAI 成立的初衷:一是为了打破 DeepMind 在人工智能领域的垄断;二是为了创造造福全人类的安全人工通用智能。自成立以来至 2020 年,OpenAI 从未急于寻找商业变现路径,一直坚定地投入在极大消耗的技术开发之中。然而,随着 GPT-4 的推出,OpenAI 渐渐地向着不够“Open”的方向进发。GPT-4 开放应用后,OpenAI 没有放出技术细节;与微软的资本深度捆绑,也使得 OpenAI 公司或急于“变现”,做出一些背离初衷的改变。不过,在目前生成式 AI 行业风起云涌的当下,在未来出现另一个 OpenAI,不断向着巨头发起挑战,刷新 AI 的极限,并书写它自己的故事,是值得期待的。而顶级 AI 人才,也或许更愿意跟随着这些更为开放、且更具有创新精神的企业一同不断成长。