文章主题:数十亿用户, 零边际成本, 需求驱动, 多边网络
本文原标题为《Attention is all you need》,作者 Packy McCormick 深入探讨了 OpenAI 如何有潜力挑战 Google 和 Meta 的地位,并成为未来网络使用的首选入口。为什么包括微软、Google 在内的大厂们都不计盈利地烧钱,力求在 AI 领域抢占高地?Packy McCormick 由浅入深地剖析了 OpenAI 可能带来的商业影响,全面解释了一个美好的意外为什么会成为改变互联网的奇迹。本文来自微信公众号:APPSO (ID:appsolution),作者:Packy McCormick,头图来自:视觉中国
Google Brain 团队在 2017 年发表的一篇论文引发了 AI 革命,论文标题极具吸引力:“注意力就是你所需的一切(Attention is All You Need)”。
该论文介绍了 Transformer 架构,该架构后续成为了包括 OpenAI 的 GPT-4 在内的大型语言模型之核心。
正如 Chroma 联合创始人 Anton Troynikov 此前解释的那样,Transformer 通过集中注意输入的正确部分,便可以完成许多任务,不需要其他类型的神经网络层,例如卷积或递归连接的层,它仅需要“注意力(Attention)”。
同年,本·汤普森(Ben Thompson)继其经典的聚合理论之后,撰写了《定义聚合者》(Definition Agregators)一书,针对通过控制人们对丰富资源的需求来获取价值的企业进行分类。聚合者具有三个明显的特征:
1. 与用户直接相关;
2. 为用户提供零边际成本的服务;
3. 需求驱动多边网络来降低采购成本。
Google 和 Facebook 便是典型的超级聚合者。
数十亿用户涌向其平台,享受其他用户所免费创作的内容。随着需求的不断扩大,越来越多的人投入到内容创作中,进而满足更为丰富的需求,进一步吸引更多的创作者加入,形成一个良性循环。在此过程中,吸引用户的成本将逐步降低。
更好的用户体验会带来更多用户、更多供应商和广告商,进而带来更多用户,如此往复。
这篇文章所要表达的观点与“Transformer”论文基本相同:在互联网上取得巨大成功,唯一需要的就是吸引注意力。
在2015年12月,OpenAI正式宣告成立,初期便以非营利组织的身份运营。得益于埃隆·马斯克、彼得·蒂尔、山姆·阿尔特曼、杰西卡·利文斯顿、瑞德·霍夫曼以及伊利亚·苏兹克维尔等多位知名人士的慷慨捐赠,OpenAI在成立之初即获得了超过10亿美元的资金支持,从而确保了其能够在不依赖盈利的情况下持续运行。
一位知名的风险投资专家曾对OpenAI表示出浓厚的兴趣,并对这个创新团队充满敬意。然而,鉴于该创业公司尚未制定出具体的收入和盈利计划,这位专家作为有限合伙人,无法找到充足的理由将其有限的资金投入到这个项目中。
在去年的夏天,当DALL-E2将OpenAI推到聚光灯下时,一个团队成员向我透露,尽管他们的技术能力出色,但在如何实现盈利方面仍存在困惑。
然后,就在去年 12 月份,OpenAI 发布了 ChatGPT。团队后来表示,他们本来没有对它抱太大希望 ——它只是一个“研究预览”,但几乎一夜之间,它掀起了热潮。
对于我们这些喜欢这种东西的人来说,它的 12 月发布是那种“我记得当时我在哪里”的时刻(我当时在洛杉矶的一家酒店大厅,在第一次尝试之后立刻发了一条推文)。
ChatGPT 瞬间爆火。两个月后,它就吸引了 1 亿用户。YC W23 班(YC:Y Combinator 初创公司孵化器)中近一半的人都在使用 OpenAI 的 API 构建应用程序。
GPT-4 的发布引起了广泛关注,作为继披头士乐队最后一张专辑后的备受期待之作,它并未令人失望。与此同时,OpenAI 也在近期推出了 ChatGPT 插件。
在发布时,解释称:“自我们推出ChatGPT以来,用户便不断呼吁添加插件。”
自发布以来,许多人已将插件与苹果公司的 App Store 相比较,该服务在 2022 年支付开发人员 600 亿美元(但很可能自己收走了 150 亿美元)。
我认为它的潜力远超App Store,而且我并不想成为像OpenAI那样过度炒作的人。为此,我将投入整篇文章来阐述我这样的观点。
在短短一年多的时间内,OpenAI 从一个鲜为人知且尚不确定盈利模式的公司,成功地转变为我国历史上可能最具优势战略地位和商业模式的公司之一。这一转变堪称意外。
尽管该技术值得得到赞誉,但其转化为霸主业务并不确定,直到数以百万计的人急于使用其新的消费者友好型界面。自那以后,发展势头快速。
图片来自:原文
说到将惊人的技术变成同样惊人的商业机会时,其实你也猜到了:注意力就是你唯一需要的。
现在,如果 OpenAI 愿意,它可以通过建立一个行动引擎来构建超级聚合器。
行动引擎包含搜索和让用户完成各种动作的任意数量的产品,在没有任何复杂操作的情况下为用户完成任务。
如果聚合器可以控制需求和商品化供应,那么超级聚合器就可以在多个前线控制需求,将注意力转化为行动,分散任何为其提供食物的供应商,甚至聚合聚合器。
它甚至可以让苹果、Google 和 Facebook 的模式变得软弱无力,直到它们反击为止。我将解释为什么 OpenAI 的意外商业模式让我感到兴奋,但首先,我们需要快速复习一下当前科技业务模式的巨头。
超级聚合器
如果你正在阅读这篇文章,我假设你已经了解了 Google 和 Facebook 的业务模式——人类所知道的最赚钱的机器——因此,我将保持这一部分非常简短。
Facebook(及其应用程序系列)利用数十亿用户吸引另外数十亿用户,收集这些用户的大量数据,并让广告商根据这些数据针对这些用户。
如果你是一家希望让很多某一类型的买家看到你的产品的公司,因为你认为这种类型的买家可能会喜欢你的产品,那么 Facebook 就是你应该去的地方。
然后,你只需要向他们展示一个艳丽的广告,某些人会点击它,其中一些人会购买。
因为 Facebook 拥有最多的社交粉丝(超过 30 亿用户),所以它吸引了更多的人,并且因为它拥有最多的用户和最多的数据,所以它吸引了最多的品牌广告支出。其获取需求和供应的成本几乎为零,并且广告成本几乎为零。
Google 的模式更加直接。数十亿人明确地去 Google,告诉该网站他们正在寻找什么——从某个城市的酒店信息到会计软件,Google 将高价售卖广告链接给那些能够提供这些精确信息的广告商。
这些人已经表达了他们的需求,而 Google 从有意愿获取这些需求的广告商手中获利。由于 Google 占据了最多的搜索流量——全球 93% 的搜索流量通过 Google 进行,因此它吸引了全球所有企业中最多的广告资金。它的需求和供应成本几乎没有,并且广告成本几乎为零。
2022 年,Facebook/Meta 实现了 1166 亿美元的营收,Google/Alphabet 实现了 2828 亿美元的营收,其中绝大部分来自提供广告服务。很难想到有比这更好的互联网商业模式。但我认为 OpenAI 无意中创造了更好的商业模式。
注意力 智能
OpenAI 的潜在商业模式很难与其他公司直接比较,因为它是一个聚合器、API 和平台形态的混合模型。
如果你可以想象一堆应用程序以 Google Search 为其核心功能,Google 是找到这些应用的主要地方,并且这些应用与其他应用搭配使用能够更好地工作时,那么你已经接近 OpenAI 可能实现的内容了。
OpenAI 从各个角度打击其合作伙伴:
掠夺注意力:ChatGPT 是 OpenAI 的前端,“聚合器”,在前两个月内已经吸引了超过 1 亿用户。ChatGPT 将让 OpenAI 控制丰富资源的需求,并为这些资源进行优化。
智能 API:一些新产品正在围绕 OpenAI 的 API 构建,一些现有的产品正在围绕 OpenAI 的 API 进行重构。与大多数 API 服务非核心内容不同,OpenAI 的智能 API 是许多应用产品核心功能的一部分。
插件玩法:无论是构建于 OpenAI 的 API 上还是不使用 API 的产品,现在都可以插入 ChatGPT 本身(并在长期内潜在地插入 OpenAI 的智能 API),将产品变成平台和聚合器,并将更多的注意力带到 ChatGPT 上。
与应用商店不同,它只列举应用程序,而不具备它的功能,这实际上将任何插件转换为 API,并为 ChatGPT 提供了该公司的全部功能。
通过创造出一款真正精品的产品,获得了如此多的用户关注,OpenAI 还吸引了开发人员使用其智能 API 和插件平台。
在短期内,这对开发人员来说是非常好的,他们能够获得更多的功能和用户,但这是一种赛特式的交易。构建在智能 API 上的开发人员依靠 OpenAI 提供核心功能,而插件开发人员则将他们的核心功能交给了 OpenAI。在这两种情况下,OpenAI 获得了更多的注意力、影响力和实力。
掠夺注意力
注意力非常重要,而 ChatGPT 恰恰能够掠夺你的注意力。
ChatGPT 是一个能够回答用户问题的聊天程序,仅推出两个月就达到了 1 亿用户,是迄今为止最快的。
尽管 Google 没有更新该数字,并且不公布每日活跃用户数量,但很容易想象,在一年内,数以亿计的人将每天都开始使用 ChatGPT 上网。
汤普森在 “定义聚合器” 中写道:“聚合器的关键特征是它们拥有用户关系。” 如果人们去你的网站上查找互联网上的任何内容,你可以告诉他们去哪里。
如果人们打开你的应用程序,想要打车,你可以告诉他们找哪辆车。拥有客户关系可以让聚合器商品化其供应商并从每笔交易中捕获更多价值。
ChatGPT(以及更广义的 GPT)更进一步地完全脱离了其 “供应商” 。Google 可以向你展示其算法想要的任何网站,并在顶部突显的框中总结该网站,但其工作仍然是将人们发送到网站上。
另一方面, ChatGPT 阅读了互联网上大部分可用内容,并在聊天中提供完整的答案以回答任何提示。它不仅是一个起点,而且越来越多地成为用户在网上完成其许多事情的目的地。
当 ChatGPT 出现时,一些 AI 专家进行了相当多的批评,认为它并不是一项技术进步,只是旧模型上的华丽接口。
这忽略了产品方面的重点——接口是至关重要的——但在商业模式方面尤其忽略了重点。ChatGPT 的界面是一个吸引用户注意力的工具,一旦你获得了注意力,就可以按照自己的方式将其引导。
智能 API
ChatGPT 不仅吸引了消费者的注意力,也吸引了开发者的想象力。尽管 GPT-3 已经可以通过 API 使用,而一些开发者已经在使用它,但是 ChatGPT 周围的热潮似乎推动了几乎每个开发者都考虑如何将 GPT 纳入其产品中。目前,大约有一半的当前 YC 创业者正在使用 OpenAI 的 API 构建产品。
这些公司被嘲笑为 “GPT 套壳” ,许多人怀疑它们在风险投资范围内的可行性。我对这些企业的担忧是它们将多少东西交给了 API。
在《APIs All the Way Down》,我指出 API-First 公司似乎有一个甜蜜点:
强大的 API-First 企业正好处于这个甜点位置:它们向客户提供重要但非核心的功能,例如接受付款,提供云安全或向客户发送通信。
当 API 提供云托管、付款、文本消息或任何公司通常需要做但不会提供竞争优势的事情时,插入 API 是有很大意义的。
但是,当 API 提供智能服务时会发生什么?
OpenAI 的 API 基本上是智能 API。写几行代码,你的产品就可以完成一些相当聪明的人可以完成的事情,比如回答客户服务聊天、发现药物配方或辅导学生。
当然,大多数使用 OpenAI API 的产品不仅仅是在不同接口中提供 ChatGPT,它们肯定需要一些微调以更好地满足客户的特定需求,但对于这些产品的大多数而言,它确实感觉它们破坏了 API 的基本规则:不要画蛇添足。
但公司该怎么办呢?花费数亿训练自己的模型,希望制造出足够不同的东西吗?不让产品变得智能吗?这正是许多公司陷入的陷阱。正如我在《Shopify and the Hard Thing About Easy Things》一文中写道:
做容易的事情有个难点:如果所有人都能做到,那么做这件事就没有优势,但你还是得做,只为了跟上别人。
然而,对于 OpenAI 来说,这是一种难以置信的情况。开发人员必须付费使用 OpenAI 的 API,并且编写那些用于在其产品中纳入智能的几行代码的每个公司都使下一个公司更容易将其视为标准。
此外,它为 OpenAI 带来更多的关注:现在,有大量营销人员在代表 OpenAI 推销其产品价值。
一个星期之前,利用套壳 GPT 创业还是可行的。
有些人非常热衷于 ChatGPT,希望在某个特定事情上获得约 80% 的体验——比如得到旅行行程的好建议,然后去执行它们。
而另一些人愿意支付每月 $10 来使用更定制化的应用程序,获得更具体的建议并预订旅行。
然而,OpenAI 随后宣布了 ChatGPT 插件。
智能插件
在插件上,使用 OpenAI API 构建的产品插入到 ChatGPT 本身中。
星期四的时候,我在飞机上,虽然可以发信息但没有 WiFi。这时,我的 PBD 聊天室里,Ben Rollert 和 Dror Poleg 给我发了个 ChatGPT 开放插件的链接,但我打不开:
Ben:[推特链接,我打不开]
Ben:太厉害了
Ben:这是新的平台转换..
Ben:上次我这么激动是小时候用 28K 调制解调器上网玩
Packy:我在飞机上只能发信息,推特链接是什么?
Dror:ChatGPT 从其他应用程序中获取插件
我们不是唯一兴奋的人。当我的 WiFi 最后开始工作时,我发现推特上充满着敬畏和恐惧的声音。
OpenAI 将在 ChatGPT 中加入插件,包括:
浏览插件: 一种实验模型,可以知道何时何地浏览互联网。
代码解释器: 一种可以使用 Python 处理上传和下载的实验 ChatGPT 模型。
检索插件: 开源检索插件允许 ChatGPT 访问个人或组织信息来源(在许可下)。
第三方插件: 一种实验模型,可以知道何时何地使用插件。
如果智能 API 让公司将 Google 的智能引入其产品,那么插件让公司成为 API,向 Google 的智能提供信息。
任何产品,无论大小,都可以成为 OpenAI 用户可以自动连接到他们的“个人动作引擎”的 API。
现在,有了合适的插件,ChatGPT 可以做许多 GPT Wrapper 可以做的事情。一下子, ChatGPT 拥有了更多的功能。
现在,OpenAI 只与 11 个预先审核的合作伙伴合作,但这是一项重大升级的原因。
首先,它填补了 GPT 迄今为止存在的空白。即,它提供了最新的信息,使它成为一种更可行的搜索替代方案,而 Wolfram 的集成则为 ChatGPT 提供了“计算超能力”。
几周前,ChatGPT 几乎无法进行加法运算;而现在,它可以进行复杂的数学运算、运行算法、函数绘图。
其次,正如许多人指出的那样,这是 OpenAI 成为平台并建立自己的应用商店的举措。
但是平台和应用商店的类比是不完全的,因为应用商店不是单独的目的地,它只是人们去寻找应用程序的地方,他们然后单独使用这些应用程序。
OpenAI 正在构建第三种东西。
最重要的是,插件将使 ChatGPT 成为几乎所有内容的目的地:搜索、发现、旅行计划、餐厅预订、礼品购物、草草完成的拟定、研究等等。
与传统平台不同的是,用户可以在其中找到和下载应用程序,ChatGPT 消耗插件并将其功能吸收到主要产品中。它是把一个产品作为平台,或把一个平台作为一个产品。
有了浏览插件,它将做到搜索所做的一切,还能进行定制。有了第三方插件,它就成为一个平台,在这个平台上,所有供应商都向平台添加更多的功能,并在这个过程中向 OpenAI 的关注点发送其需求。
你会去 Kayak.com 预订机票,还是让 ChatGPT 为你计划旅行并预订最好的机票?你会去 OpenTable.com 预订晚餐,还是让 ChatGPT 为你预订 8 个位置的餐桌,让它处理 OpenTable?
我想,当人们非常确定自己想要什么时,他们可能仍然会去这些网站,但对于大多数情况,ChatGPT 都是最好的选择。即使是在最后一句话中,如果我确切地知道自己想要什么,为什么不直接告诉 ChatGPT 呢?
Google 有 Google Flights 和 Google Shopping,比传统搜索更接近推荐最佳航班和商品,并减少点击和浏览等干扰。
此外,当人们在 ChatGPT 中时,很容易从研究演示文稿切换到让它帮忙预订旅行。在当前版本中,通过 Kayak 插件预订旅行会更加容易,可以节省几个点击。但在不久的将来,如果你非常信任 ChatGPT,预订可能仅仅需要发送一条消息就能轻松完成。
更加离谱的是:你会直接转到 Zapier.com,费劲地手工制作一堆 Zaps 来连接你的企业使用的所有不同系统,还是只需要告诉 ChatGPT:
“嘿,我想要来自 Zendesk 的客户支持票,创建一个 Airtable 条目并在 Slack 的 @customer-care 频道中通知?”
插件可以将需要搜索和点击的手动操作转化为类似于与智能人对话一样简单的操作,即使您自己不是完全清楚您要的是什么,智能人也能理解。
减少点击是在线商务的生命线,这是插件的重要部分之一,但是能够灵活地键入(很快会说话)任何愿望并使其成真,这是一个创变者。
您听到的是吸引用户的关注冲进了 ChatGPT 这个平台。如果只需要关注,这是捕获大量关注的重要一步。
这还比较早。小组用户可以访问少量插件。OpenAI 并没有说它计划如何整合,尽管很容易想象。
如果谷歌通过提供高目的用户的商业企业,OpenAI 可以通过将这个目标转化为行动来构建至少同样好的东西。它应该能够在推动的交易上捕获费用,而且在许多情况下,在其智能 API 使用的伙伴看到更多的交易量时,捕获更高的 API 费用。
您甚至可以想象,OpenAI 可以在 Intelligence API 中公开插件功能,将插件引入其上构建的所有应用程序,将其变成一个智能平台。
这将对插件合作伙伴有好处——被构建到更多的产品中将增加需求——对于 OpenAI 也有好处。
更多的用户将吸引更多的插件构建者。即使这意味着从 ChatGPT 吸取一些注意力,也可能值得早期发展生态系统。每个人都赢。
如果 OpenAI 决定与其伙伴进行友好合作,那么所有这些都是可以实现的。
但是,如果 OpenAI 优化 ChatGPT 用户,则将消除大量企业并迫使它们改变运营方式。
把服务接入顶级聚合器
本 · 汤普森在《聚合器理论》中提到:
以聚合理论为例,不再基于独家供应关系来竞争分销商,而是将供应商作为商品化,将消费者/用户作为第一重要的优先事项。
由此延伸,这意味着决定成功的最重要因素是用户体验:最好的分销商/聚合器/市场制造商通过提供最佳体验赢得最多消费者/用户,从而吸引最多的供应商,从而在良性循环中增强用户体验。
之前,我们谈到了 Google 和 Facebook 的模式。他们提供他们认为与用户相关的广告,用户点击这些广告并决定是否以及购买什么。
OpenAI 插件的早期预览看起来有些相似,但比 Google 更进一步。第三方插件演示视频展示了一个 Instacart 交易的示例:对素食食谱的请求变成了预先加载的 Instacart 购物车,用户可以点击、探索和购买。
虽然演示非常令人印象深刻,甚至远远超过在 Google 上执行相同操作,但我仍然感到它仍处于仿拟阶段,即合作伙伴的“吸引”阶段,这是从 Chris Dixon 借来的两个想法。
它还在学习 ——也许我不喜欢那个食谱建议,或者我喜欢但我想在购物车里更换一些配料。在当前的实例化中,我能够做到这一点(也许我一直都会这样做)。
然而,可以想象,一旦接收了足够的人类反馈的 RLHF(人类反馈强化学习), ChatGPT 将消除其中大部分的点击,以优化用户体验。
嘿,我星期天想要一顿素食,加点豆腐,我上午都在家。
好的,您的配料将于星期日上午10-11点之间送达。我会在那时给您发送一个食谱。
也许那个订单将发给 Instacart。也许它将发给能够以最便宜的价格在最紧迫的交货期限内提供最好的杂货的产品。
而“最紧迫的交货窗口”不仅仅意味着每个特定插件说的交货窗口,而是哪个插件在成千上万、甚至是数百万的订单中实际交货最接近它表示要交货的时间。
还有另一种聚合器,不完全像汤普森那种,它坐落在特定类别的一堆应用程序之上,并公开来自所有应用程序的数据,以便客户做出最佳决策。如果您看电视,您可能已经看到某些著名的广告,比如酒店类别中的 Trivago 和 Priceline。
这些广告是为了引起顾客的兴趣,并把顾客所需的最佳价格或其他服务分配到不同的平台。
这些企业本质上是营销企业,这可以从 Priceline 的母公司——94 亿美元的 Booking Holdings 在 2022 年销售和营销费用中花费了七十八亿美元,占总收入的四十五% ,是 SG
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!