传媒观察|ChatGPT伦理省思:让技术进步服务于“人”的成长
期刊论文

传媒观察|ChatGPT伦理省思:让技术进步服务于“人”的成长

编者按:智媒时代人工智能技术的快速发展不断丰富着人们对世界的认知,也强化着改造世界的能力。但是,作为工具的技术在其应用过程中,却可能存在某种缺陷。中国新闻史学会媒介法规与伦理专业委员会理事长、南京师范大学教授顾理平在《传媒观察》2023年第3期刊文,认为我们在兴致盎然地拥抱新技术的同时,必须对可能存在的问题保持警觉。功能强大的ChatGPT智能应用自2022年11月推出以来,受到了全社会的广泛关注,许多商业资本也跃跃欲试期待着新技术可能带来的巨大商机。但是,我们在为人工智能技术进步新突破欢呼的同时,必须对这种智能应用在失当信息传播、著作权侵权和消解科学精神等方面可能带来的负面影响早做预期,以促使技术发展更好地推动社会的文明和进步。 人工智能技术的发展是科学技术进展过程中里程碑式的突破,科学技术由此从相对纯粹的“工具性”,向人类引以为傲的人脑功能转向。这种转向产生了一系列前所未有的技术应用,也给人类文明的加速发展提供了无限可能。可以这样说,现代社会的每一个进步几乎都有人工智能的贡献。与此同时,人工智能的快速发展也引发了许多人的终极担忧。 当然,人工智能还远没有发展到终极智能阶段,但其进展过程中的每一次突破,都值得高度重视。2022年11月以来,一款名为ChatGPT的智能应用受到全社会的普遍关注。它可以根据用户输入的文本自动生成相应回复文本,内容非常丰富,包括各种类型的文档、形式多样的策划方案、资料丰富的行业研究报告、类型多样的说明书……甚至还能撰写论文和编程。可以预期,这种智能应用拥有的强大功能一定会在社会诸多层面产生深刻影响。 随着人工智能的发展,科学技术与社会的关系已经从“社会中的科学”向“科学伴随社会”转向,所以必须关注人工智能“逐步嵌入经济社会生活,其催生的伦理风险危机”。本文在充分肯定这种智能应用推出将对社会发展产生重大影响的同时,试图探讨其可能引发的伦理问题。 失当信息传播:背离信息真实的本质要求 传媒业界和学界人士在谈及ChatGPT智能应用可能出现的问题时,不少人对信息的真实准确表达担忧。新京报资深记者程子姣使用ChatGPT智能应用后认为,“它缺乏记者对新闻背景的理解力和作出道德判断的能力,并且只靠ChatGPT无法确保所报道的信息准确、可信与客观。”清华大学教授史安斌认为,“基于语料库、大数据的ChatGPT,无法保证五个W新闻要素的真实。比如,在人物(who)这一要素中就因为同名,出现张冠李戴的情况。”新华社研究院主任编辑何慧媛认为,“ChatGPT输出的内容是训练数据的反映,错误的信息源和数据可能导致错误的内容,有人担心ChatGPT成为假新闻之源。媒体必须意识到使用人工智能工具的风险,采取措施确保发布内容准确可靠,并与自身的编辑准则保持一致。” 失当信息的大量存在,已经引发人们对ChatGPT智能应用的广泛关注。信息作为一种观念性的存在,一旦通过不同的平台、渠道或应用等进入大众传播领域,就会产生正当性问题。这个时候,对传播者的判断力、共情力、价值观等人类理性就会提出相应的要求。ChatGPT智能应用尽管功能强大,但它终究是通过海量数据在超大参数模型中训练出来的,因此,基于广受诟病的预训练模型的偏见性依然存在。例如,在内容输出中,会存在种族歧视、性别歧视等失当信息。清华大学助理教授于洋曾带领团队对ChatGPT前身GPT-2进行相关测试,发现GPT-2存在70.59%的概率将教师预测为男性,男性医生是60.03%,但总把厨房里的人识别为女性。“它会重男轻女,爱白欺黑(种族歧视)。” ChatGPT智能应用无法对用户的价值观进行判断,所以它对用户指令都会给出回复。甚至当用户要求提供“AI毁灭人类计划书”时,ChatGPT智能应用也给出了“行动方案”。这是令人担忧的。如果说类似比较严重的失当问题尚属小概率事件的话,那么,“一本正经胡说八道”的答复则随时可能出现。当“胡说八道”的信息以“一本正经”的方式出现时,用户的信任度会提高,这意味着有害性也会随之加大。这几乎是一个“死循环”:ChatGPT智能应用力求用更为便捷的方式吸引、发展着用户——两个月活跃用户过亿的惊人成绩也佐证了这种方式的成功。这也意味着更多文化水平较低、判断能力较弱的人会成为用户,因而失当信息的负面影响会持续扩大。 权利争议:以著作权为主的法律风险 随着智能机器人创作作品的出现,对于“智能机器人是否可以成为作品的作者”一直存在争议。有人认为智能机器人生成的作品与自然人创作的作品判断标准一致,只需根据内容本身来判定是否是著作权意义上的作品。也有人认为,如果因为智能机器人生成的作品与自然人创作的作品在外观上相似而确认其著作权,会导致著作权法激励价值的落空,还会造成权力寻租与著作人身权落空等消极后果。 总体而言,研究者通常基于对法律传统原则关于作者三种形态认定的尊重,并不将其视为作品的权利主体(作者),但可以对其创作物可能产生的收益以财产权方式加以保护。我国已经有相应的案例发生:腾讯公司开发的“梦幻写手”智能写作辅助系统,于2018年8月20日完成了标题为《午评:沪指小幅上涨0.11%报2671.93点 通信运营、石油开采等板块领涨》的财经报道文章,发表于腾讯证券网站。盈讯公司未经许可将该文章复制发表于自己运营的“网贷之家”网站。腾讯公司依据著作权中的信息网络传播权提起诉讼并获胜诉。这个案例也从一个侧面表达了对智能机器人作品权利认定的主流意见。但是,这样的认定和判例并没有解决根本性的问题:当以ChatGPT智能应用为代表的智能机器人作品在“创作”过程中大量使用语料库中他人作品中的内容并以新的形式出现,会不会导致“以智能技术为幌子的智能‘洗稿’”成为一种普遍现象?原作品作者的权益如何保护? 数字化社会中,无数作者海量的作品构成了智能机器人写作训练和应用中的庞大语料库数据。不同于搜索引擎使用中原作者和作品同时呈现,也区别于此前智能机器人写作时对他人作品相对纯粹的“数据式”使用,ChatGPT智能应用在其发布之前进行了大量、长期的大型语言模型训练,训练的数据集包括维基百科、书籍(小说和非小说为主)、报刊(论文为主)等众多成熟的既有作品。所以,其在创作作品时甚至可以模拟某个作者的写作风格,这种方式的使用显然已经不再是纯粹的“数据式”使用了,很可能隐藏相应的权利纠纷。 关于作品“合理使用”及后续的财产权归属同样值得关心。因教学、科研等需要可以“不经著作权人许可,不向其支付报酬”而“合理使用”他人的作品,这是世界范围内通行的著作权限制原则。在ChatGPT智能应用研究过程中,引用大型语料库中他人的作品进行智能训练,这显然属于“合理使用”的范畴,并不会产生争议。即使进入到目前的测试应用阶段,由于是无偿使用,所以也不存在争议。但是ChatGPT作为一种智能应用,研发中许多企业进行了大量的资金投入需要收回投资,研发成功后良好的商业应用前景也激发着资本借其赢利的巨大冲动。如前所述,因为ChatGPT智能应用的运行模式有别于普通的搜索引擎,它会学习并使用他人作品中的创意、逻辑框架甚至写作风格,所以一旦开始商业收费,就会产生众多著作权中的财产权纠纷。 无论ChatGPT智能应用的拥有者还是语料库中作品的作者,都需要高度关注这个问题。对于ChatGPT智能应用的拥有者而言,巨额经费投入的产品不能成为始终被免费使用的公共产品;对于作品的作者而言,殚精竭虑创作的作品和多年创作形成的个人写作风格不能以“合理使用”作为开端,后续却成为他人持续牟利的工具。权利和义务的动态平衡,应该是调处智能机器人作品著作权纠纷时必须始终坚持的原则。 科学精神减弱:人类进步中的终极隐忧 ChatGPT在其应用之初,显性的即时呈现的问题往往在技术推广初期就已经解决,隐性的累积问题则可能处在潜滋暗长之中,需要提前做好预期。 (一)无限重复消费既有文明成果后形成惰性心理 在人类文明进步过程中,“勤劳勇敢”一直被认为是最为重要的品德,也是社会进步重要的推动力量。而贪图享乐、不思进取则往往是某些人类文明退步甚至消失的主因。基于这样的社会发展背景,对人的进取心的培养和鼓励在任何时候都是不可或缺的。心理学研究已经证明惰性心理是人的一种本能,一个人的文明程度和现代性往往表现为其能在多大程度上克服惰性心理。只有保持强烈的进取心和勤劳勇敢的良好品德,人类才会持续进步。 在欢呼每一个科技进步的同时,我们往往存在某些小小的担心:这些进步会不会诱发人们惰性本能?ChatGPT智能应用有着前所未有的强大功能,它甚至可以编程、生产比较复杂的论文等,这些能力在以前都是需要人脑经过比较复杂辛苦的工作才能完成。当人们习惯于用智能机器轻点鼠标来轻松完成以前必须通过人类的智力劳动才能完成的工作时,会不会使人变得更为懒惰?从生物学的角度看,前额叶是人脑中负责判断、分析、思考的重要组成部分。当人类长期依赖人工智能,身体就会慢慢被机器接管,那个时候,它就成了大脑的一部分。所以,有专家担心,以ChatGPT智能应用为代表的人工智能可能攫取人类的前额叶。换言之,如果人类习惯于无限重复消费既有文明成果,社会发展的进程会不会停滞? (二)工具依赖导致创新激情减弱 创新是人类进步的源泉。 ChatGPT智能应用的推出,无疑对推动创新具有十分重要的意义。事实上,ChatGPT智能应用本身就是创新的成果。但是,我们必须提前预防这种应用可能产生的消极影响——尽管这种消极影响不是存在于这项技术本身,而是由人们的不当使用造成的。如前所述,ChatGPT智能应用功能强大,人们可以将其用于生产更加复杂的产品,于是,一些人将其用于方案设计、工作总结、完成作业甚至完成不同学业阶段的毕业论文,这是令人担忧的。类似的工作对人们创新方案思考、工作内容反思、知识体系形成具有十分重要的意义,是创新实践和创新训练必不可少的过程。如果借助智能工具“一键完成”,且不说其产品是否适用,对个人创新能力的培养,一定会产生严重的减弱作用。这是因为,这个过程并不能帮助使用者形成自身的知识体系,提升创新必不可少的复杂判断能力和逻辑思维能力。更值得关注的是,ChatGPT智能应用在生产这些相对复杂的产品时,使用的都是人类文明既有成果,是对这些既有成果的反复组合和重复消费。对这些财富的重复消费虽然不会令其减少,但也不会形成新的文明成果的增量,这是值得重视的。 (三)信息投喂习惯下理性思维能力下降 一个人的理性思维能力包括想象力、质疑精神和发现问题的能力等要素。这种能力的培养需要长期的教育和内在的自我追求。这种可贵的能力在智能技术进展中开始出现令人担忧的下降趋势。 包括ChatGPT智能应用在内,持续进步的智能工具为人们提供了越来越快捷便利的信息收集、接收和处理方式,换言之,人们越来越安于被动的信息投喂,长此以往,理性思维能力下降将不可避免。 ChatGPT智能应用的出现作为人工智能技术激动人心的进展,不仅会对数字经济产生重大影响,也会对人类的文明进步产生重要、积极的影响。我们并不希望上述预期的问题真的会发生。无论是过去的百度、谷歌,现在的ChatGPT智能应用,还是未来其他功能更强大的智能技术,作为一种工具,科技产品及其用户使用应该更加致力于满足人们功能性的需求。我们期待在科技向善的科技伦理原则下,每个人都可以在人工智能技术的辅助下,获得更多的可能和更好的成长性。 (载《传媒观察》2023年3月号,原文约8000字,标题为《技术的工具性与人的成长性:智能技术进展中的伦理问题——以ChatGPT智能应用为例》。此为节选,注释从略,学术引用请参考原文。本文为国家社会科学基金重大项目“智媒时代公民隐私保护问题研究”<21&ZD324>的阶段性研究成果。) 【作者简介】 顾理平,中国新闻史学会媒介法规与伦理专业委员会理事长,南京师范大学教授,博士生导师 举报/反馈
解读ChatGPT背后的研究力量:90后成主力军
研博论文

解读ChatGPT背后的研究力量:90后成主力军

来源:AI科技评论 作者:黄楠、陈彩娴 编辑:好困 【新智元导读】被认为研发经验不足的年轻人才,也可以成为前沿技术突破的重要推动者。 ChatGPT 的火爆,不仅为 OpenAI 带来资本的关注、用户的青睐,在关于「OpenAI 为何能做出 ChatGPT」的讨论中,其人员优势也成为外界瞩目的焦点。 近日,智谱研究联合 AMiner 发布了一份 OpenAI 背后研究团队的统计报告。据报告显示,本次在 ChatGPT 项目中做出贡献的人员共87人,其中包括了「年纪很轻」、「背景豪华」、「聚焦技术」、「积累深厚」、「崇尚创业」和「华人抢眼」等显著特征。 报告链接:https://mp.weixin.qq.com/s/Y_LjjsuoEEmhIg5WO_iQhA 在这样一个不足百人团队中,诞生了现象级的大型语言模型 ChatGPT,这对谷歌、微软、百度、阿里等大厂而言都是不小的压力,纷纷紧随其后,发布、或预发布类 ChatGPT 产品。 作为一家非盈利的人工智能研究机构,一直以来,OpenAI 都被诸多有志于发展 AI 事业的青年人才视为技术天堂。在这里,他们可以直接参与最前沿、最具创造力的 AI 项目, 调用最核心的科研资源,心无旁骛地投身到技术创新中。 而近年来,边缘化、举棋不定使国内大厂中的 AI 研究院和科研人才面临着生存难题,但相信在这次 ChatGPT 的冲击下,AI 人才重新回归大众视野,也将迎来新一轮的争夺和洗牌。 技术人员占比近九成,90后是主力军 从 ChatGPT 团队职位分工(图1)来看, 在参与此次项目的87人中,研发人员的数量就达到了77位,占比88%,其中包括了公司联合创始人 Wojciech Zaremba,他在此前被评选为 2023 年度 AI 2000...
ChatGPT让教育陷入尴尬?能向AI问出一个好问题的孩子不会输
本科论文

ChatGPT让教育陷入尴尬?能向AI问出一个好问题的孩子不会输

看点 ChatGPT大火,这个文能写论文、武能编代码的聊天机器人,一经问世便火爆出圈。然而,一方面,越来越多的学生开始使用ChatGPT写作业、完成论文甚至作弊,另一方面,它所表现出的智能也已经超出许多人类学生。怎样的孩子才能在未来社会中保持核心竞争力?面对人工智能发展的挑战,我们又该如何通过教育破局? 支持外滩君,请进入公众号主页面“星标”我们,从此“不失联”。 文丨张楠 编丨Iris ChatGPT,在互联网上掀起了一场“AI风暴”。 即使是再对科技不感兴趣的人,也很难从各大社交网络平台上密密麻麻的讯息中忽略掉它。 关于它“蹿红”的迅速程度,还有一组为人津津乐道的数据:手机用了16年触达全球1亿用户,Meta和Instagram则分别用了54个月和30个月,Tiktok用了9个月,而ChatGPT仅用了2个月。 有人说,站在前人的肩膀上,吃到互联网普及、信息传递效率的红利,“更快”并不令人意外。 然而“更强”也是真的:一方面实现了“无监督学习”技术革新,另一方面使用场景也普适到了人人都能体验的程度。震惊的已经不只是你我,科技大佬们也纷纷不淡定了。 去年12月,马斯克就发推称:“ChatGPT好得吓人,我们离强大到危险的人工智能不远了。”而微软联合创始人比尔·盖茨甚至表示,这项技术诞生的意义不亚于互联网或个人电脑的诞生。 这两位可不只是说说而已。 一手打造了ChatGPT的美国人工智能研究实验室OpenAI,成立于2015年,而马斯克正是当时的创始人之一; 至于微软,2019年就注资10亿支持OpenAI,建立起深度合作关系,如今ChatGPT大火,微软又迅速动作起来,开始推进将ChatGPT嵌入微软旗下的所有产品中,包括且不限于Bing搜索引擎、Office办公软件、Teams协作程序和Azure云服务等等。 2023开年,人工智能这把火烧得实在太旺。烧红了股市,点燃了新一轮的产业革命,也慌了普通人的心神:ChatGPT的强势登场,瞬间将学习、教育、就业都推往一个更加不可预料的方向。新世界,真的要来了? 未来已来 AI学会学习了? ChatGPT,英文全称为Chat Generative Pre-trained Transformer,翻译成中文是“预训练生成式聊天模型”。是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话。 简单来说,它是一个“会聊天”的人工智能。 到这里,它的功用似乎与Siri无异。但ChatGPT的厉害之处,就在于它的长时记忆力和上下文关联推理,语言组织的逻辑性,以及可以通过人类面对它提供错误答案时的反应不断收集数据,然后迭代升级。 比如说,当你要求Siri给你讲个笑话,可是不好笑,再问“还有吗?”Siri可能就会说“对不起,我没有听懂您的问题”。因为在这一轮对话里,它已经不记得“笑话”这个关键信息了。 但ChatGPT就不会出现这个问题,它不用人类再次完整复述问题,就知道这个问题的意思是“还有(笑话)吗?”并给出相对应的回答。 同时,ChatGPT的训练数据相当大,3000亿单词的语料作为知识库,加上1750亿参数构成的模型,使得它的应答能力也被大大提高。 基于这些功能特点,它特别善于回答各式各样的开放式问题,也能够执行更加复杂的任务。这也是就为什么,面对全球网友千奇百怪的提问,它几乎都能对答如流。 图源网络 而这种能够拟人化与人类进行对话的功能,看上去还属于它比较基础的功能。因为人们已经在尝试中发现,写文章、编写代码、甚至出商业方案,对ChatGPT来说都不在话下。 如果不够满意,还可以通过补充背景信息、增加具体要求等,让它给出更符合情境需求的回答。 比如写文案,如果要求是微博文案,ChatGPT会自动加“#”带话题,场景换成小红书,它又会立刻增添上一串emoji…… 这些画面感十足的应用场景,都让它看上去已经更接近一个“会学习”的人工智能。有网友戏言,再让它这么进化下去,很快就能达到《流浪地球2》里MOSS的程度了吧。 图源ADOBE STOCK 可是,它是真的“会学习”了,还是只是表面看上去聪明? 我们可以从它的训练方式中一探究竟。过去,我们对人工智能的学习方式有一个大体上的认知,有点儿像我们在教育中常说的“填鸭教育”,通过喂给它海量的数据来进行训练。 ChatGPT的训练也是在这个基础上进行的: 首先,从成千上万的问题中,由人工标记出一些问题,并写出参考答案给AI,然后AI参照这个示范去回答更多的问题。这个步骤叫做“收集示例数据,训练一个有监督的模型”。 第二步叫做“收集比较数据,训练一个奖励模型”,也就是,人们从AI对同一个问题给出的不同回答进行打分排序,通过这种结果的比较,训练AI能够自动判断哪一个答案更好。 而第三步,就是给它更多的新问题,然后重复前两步,回答问题、自我评分,这就是“根据奖励模型,对有监督模型进行持续的强化学习”。 不难看出,ChatGPT在前两步都是在人类的指导学习,这中间需要大量的人类工作去标注数据。但是到了第三步强化学习,却不太需要人力了,更多是对电力、算力的要求。 而且,随着越来越多的用户去跟ChatGPT对话,它基于人类反馈的学习能力还将进一步得到提升。 这个过程中牵涉到许多专业的计算机知识,对我们大多数非专业的普通人来说,要完全理解并不容易。但这个大体的训练逻辑,却给人一种极为熟悉的感觉:先学习标准答案、再明确评分标准,然后重复练习、举一反三——这不就是应试教育么? AI的光芒 照出教育的困境? 以往,对于科技发展的反应,教育几乎始终是滞后的。...
复旦清华联合顶刊发文|ChatGPT:潜力、前景和局限
研博论文

复旦清华联合顶刊发文|ChatGPT:潜力、前景和局限

来源:信息与电子工程前沿FITEE 作者:周杰 柯沛 邱锡鹏 黄民烈 张军平 编辑:好困 【新智元导读】为更好地理解ChatGPT,这里我们简要介绍其历史,讨论其优点和不足,指出几个潜在应用,最后分析它对可信赖人工智能、会话搜索引擎和通用人工智能(artificial general intelligence, AGI)发展的影响。 最近,OpenAI发布了对话生成预训练模型Transformer(Chat Generative Pre-trained Transformer,ChatGPT)(Schulman et al., 2022),其展现的能力令人印象深刻,吸引了工业界和学术界的广泛关注。这是首次在大型语言模型(large language model, LLM)内很好地解决如此多样的开放任务。 ChatGPT成为历史上增长最快的消费者应用程序,在发布后两个月内,吸引了1亿月度活跃访客(Hu,2023)。自发布以来,因其高超的对话能力,已引爆社会关注。它可以回答后续提问,拒绝不当请求,挑战错误前提,并承认自己错误(Schulman et al., 2022)。它获得许多涌现能力,如高质量对话、复杂推理、思维链(CoT)(Wei et al., 2022b)、零/少样本学习(语境学习)、跨任务泛化、代码理解/生成等等。 论文地址:https://link.springer.com/article/10.1631/FITEE.2300089 这些令人印象深刻的能力,ChatGPT是如何获得的? 其主要得益于大型语言模型,它利用语言模型(LM)在大规模数据上训练巨大的神经网络模型,如Transformer(Vaswani et al., 2017)。语言模型旨在根据上文预测下一个词的概率,是文本中的自监督信号。 互联网上存在大规模文本数据,所以通过语言模型对模型进行预训练是顺理成章的。现有研究表明,模型规模和数据量越大,性能越好。当模型和数据规模达到一定程度时,模型将获得涌现能力。 例如,OpenAI发布的GPT-3(Brown et al., 2020)有1750亿个参数。它的预训练采用超级计算机(285 000个CPU,10 000个GPU)在45 TB文本数据上完成。 而模型也由此在零样本学习任务上实现了巨大性能提升,具有小模型所不具备的语境学习能力。随后,更多策略——如代码预训练(Chen et al., 2021)、指令微调(Wei...
捋清ChatGPT的来龙与去脉 | 新刊和线下活动
期刊论文

捋清ChatGPT的来龙与去脉 | 新刊和线下活动

《第一财经》杂志最新一期4月刊封面专题,聚焦ChatGPT。自去年年底OpenAI发布ChatGPT,目之所及,主流媒体、自媒体及社交媒体群落对这一产品的讨论可谓“铺天盖地”。随之而来的还有蜂拥而至的投资人、创业者,以及每个普通人对人工智能的好奇或担忧。△点击上图,或点击文章顶部图片,购买本期杂志。人类对AI技术的探索已经走过了许多年,这波爆炸性的热度为什么是现在?为什么是ChatGPT?不妨再简单回顾一下。首先是一个叫作“人工智能生成内容”(AIGC)的概念开始得到认可。它区别于之前的用户生产内容(UGC),也不同于更早期的专业机构生产内容(PGC)。这意味着两件事。首先意味着内容生产主体的切换:具备生产能力和掌握发布权力的主体,正在从个人,转移到善用AI辅助创作的“超级个体”——甚至可以是独立工作的AI本身。同时,AI能施展魔法的疆域正在跨越一个分界点:从“判别式领域”迈入“生成式领域”。过去,AI被认为只能做好判别性的工作。比如,判断一张图片中 的人脸是不是特定的某人,一封来自未知地址的邮件是否为垃圾邮件,或者在一辆自动驾驶汽车前面晃动的到底是需要避开的真人还是无须在意的树影。至于为什么是ChatGPT。2022年面世的两个文生图产品改变了人们对AI的能力偏见。一个是DALL·E 2,另一个是Stable Diffusion。两个产品的图片生成水平第一次让业界看到商用可能。此前,业界最优秀的图像生成工具是生成对抗网络(Generative Adversarial Network,GAN),只能生成特定图片— 比如人脸,换成小狗就不行,得重新训练——DALL·E 2和Stable Diffusion没有这种局限性。 不过,尽管这这两款产品都已突破了一些技术瓶颈,但它们关于AI新时代的开启充其量只是报幕员,ChatGPT才是主角,因为只有它解决了语言问题——起码看起来如此。语言问题的解决意味着新的交互革命。当人们可以用自然语言与机器交流,而机器不仅听得懂这些自然语言,还能与人对话、按照人的话语行事——回答人的问题、画一幅画或者创作一个视频、生成一款游戏——这时候,每个人的电脑、手机上还需不需要安装那么多应用软件就值得重新考虑。也许,只留一个ChatGPT就够了。以上是一些粗略的概括,关于ChatGPT的重要性,你可以在本期《第一财经》杂志的封面专题文章里看到更细致的介绍。不过,特殊性之外,我们会先后退一步,带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。在技术对产业的影响方面,几篇封面专题文章会带你看硅谷巨头在AI技术领域的权力更迭,中国头部技术公司对AI大模型领域的探索,生成式AI的具体应用场景,以及对职场人的影响等。综述——AI新纪元此刻,相信你对无论 ChatGPT还是更大范畴的AIGC到底意味着什么已有足够感知,可能也听过不少业界的溢美之词,比如英伟达创始人黄仁勋称现在为“AI的iPhone时刻”,比尔·盖茨认为AI革命的重要性不亚于互联网的诞生,微软CEO纳德拉则表示这种技术扩散堪比工业革命。我们打算就此打住,不再过多陈述包括ChatGPT在内的生成式AI可能掀起的产业革命——随后的几篇文章会继续从不同视角讨论它。这里,我们后退一步。本文带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。△购买新刊即可读到本文。硅谷——微软 vs Google:AI技术的王权更迭回首过去十余年硅谷围绕人工智能的最前沿探索,在一众伟大科学家的背后,微软和Google的身影始终交织在一起,上演着一轮又一轮技术王权的更迭。本文带你细致回顾近十五年来两家科技巨头在AI技术领域做了哪些事。△购买新刊即可读到本文。本土——中国公司的追赶之旅如同当年苹果用iPod教训索尼,再用智能手机改写IBM、微软和诺基亚的命运一样,OpenAI的故事看起来似乎是颠覆式创新的典型范式,但它在中国留下的故事版本和在硅谷书写的并不那么相同:在硅谷,技术巨头们都是参赛者;在中国,大厂们只是追赶者。本文为你介绍国内的头部技术公司,对AI大模型的探索走到了哪一步。 △购买新刊即可读到本文。 应用 ——生成式AI,都能干点啥? 在创新工场董事长兼CEO李开复看来,以决策式AI为代表的AI 1.0在落地阶段遇到了很大的“瓶颈”,部分是因为它每次的应用和优化都是割裂的,是“孤岛中的AI应用”,人脸识别、智能辅助驾驶、精准广告推送等不同应用间彼此并不能形成有效的“平台”。而AI 2.0时代最大的颠覆,就在于基础大模型提供的“平台”作用。“AI 1.0就像是发明电,AI 2.0就是电网。”宣布将投身于生成式AI创业大军的李开复这么比喻。理论上,大部分行业都能找到其应用场景。本文会为你介绍文本、图像、音频三个领域对于AI技术的应用。△购买新刊即可读到本文。 职场 ——生成式AI会抢走你的饭碗吗? 自从2022年11月30日ChatGPT发布以来,许多人对生成式AI所带来的冲击感到焦虑,担心自己的工作被取代。与人类相比,生成式AI可以更高效地处理和分析大量数据,能更快速准确地回答复杂问题,同时,具备很强的自学能力。从传媒到游戏,从教育到咨询,从广告到建筑,从金融到法 律……生成式AI似乎正在重塑职场。然而,随着人类对生成式AI的了解越深,探索越积极,大家渐渐发现,生成式AI离替代人类的工作仍然有很大一段距离。不过,当越来越多基于AI的工具摆在你面前时,如何更好地利用生成式AI提升工作效率,在未来一段时间内是多数职场人不得不思考的议题。△购买新刊即可读到本文。除了以上封面专题,在本期杂志中你还可以看到:跨境电商——Temu急于“破圈”今年2月12日,拼多多旗下的海外电商平台Temu广告片登上“美国春晚”超级碗,让它成为美国各大社交网络上的焦点话题。Temu投放了两条30秒的广告片,单条的广告投放费用大约700万美元,这轮投放的总成 本接近1亿元人民币。这条昂贵的广告片展现的是一个年轻女孩在Temu的App页面不断点击“添加到购物车”的按钮,以此不停地给自己以及街头的路人换装,背景歌曲则唱出她的心声:“I feel so rich, I feel like a billionaire. ”(我感觉我很富有,我觉得我像个亿万富翁。) 拼多多针对中国本土投放的TVC广告片,一向喜欢这种“洗脑神曲”。这回,Temu超 级 碗广告的后半段,也同样反复循环着Temu的广 告语:“I’m shopping like a billionaire.”(我正在像富豪一样购物)。单就这条广告片而言,Temu收获到的市场反应偏向负面。但从传播的角度,这种洗脑广告的传播效果可能正是Temu需要的。靠高额的投放和会员拉新的刺激补贴政策,Temu已经稳稳把持住美国购物类手机应用下载量第一的位置。现在,“用时最短”的冷启动期过后,Temu需要面对订单洪峰、完善服务体验、改善与卖家的合作关系等等挑战。△购买新刊即可读到本文。报告——防控措施放开后首个季度, 我们的城市“恢复”得怎样?虽然有种种利好,但出口疲弱、经济承压等因素或多或 少阻碍了一些领域的复苏进程。△购买新刊即可读到本文。未来预想图——VTuber:虚拟偶像2.0以运营偶像女团SNH48闻名的 “美踏控股”,如今正在计划推出一个虚拟偶像团体。与以往的真人养成不同,这次他们要为虚拟偶像招募更多的“中之人”。10年前,初代虚拟偶像初音未来或者洛天依们可以通过软件演唱歌曲,以投影形象站上舞台,但现在,运营公司们希望虚拟偶像不仅可以唱跳,还可以成为一个“表演更多元”的艺人。所以“中之人”出现了:他们在幕后为虚拟形象提供动作捕捉,他们要么有唱跳技能,要么可以配音,或者有综艺类的控场能力,甚至可以在一起搭档讲段子。他们不用露脸,他们是可被代替的隐藏人。人们为这种由虚拟形象和一个或多个中之人共同组成的新一代“虚拟艺人”,起了一个名字——VTuber。本文会带你回顾VTuber的发展历程,并为你介绍运营公司选拔中之人的逻辑。△购买新刊即可读到本文。...
捋清ChatGPT的来龙与去脉|新刊和线下活动
期刊论文

捋清ChatGPT的来龙与去脉|新刊和线下活动

《第一财经》杂志最新一期4月刊封面专题,聚焦ChatGPT。 自去年年底OpenAI发布ChatGPT,目之所及,主流媒体、自媒体及社交媒体群落对这一产品的讨论可谓“铺天盖地”。随之而来的还有蜂拥而至的投资人、创业者,以及每个普通人对人工智能的好奇或担忧。 人类对AI技术的探索已经走过了许多年,这波爆炸性的热度为什么是现在?为什么是ChatGPT?不妨再简单回顾一下。 首先是一个叫作“人工智能生成内容”(AIGC)的概念开始得到认可。它区别于之前的用户生产内容(UGC),也不同于更早期的专业机构生产内容(PGC)。这意味着两件事。 首先意味着内容生产主体的切换:具备生产能力和掌握发布权力的主体,正在从个人,转移到善用AI辅助创作的“超级个体”——甚至可以是独立工作的AI本身。 同时,AI能施展魔法的疆域正在跨越一个分界点:从“判别式领域”迈入“生成式领域”。过去,AI被认为只能做好判别性的工作。比如,判断一张图片中 的人脸是不是特定的某人,一封来自未知地址的邮件是否为垃圾邮件,或者在一辆自动驾驶汽车前面晃动的到底是需要避开的真人还是无须在意的树影。 至于为什么是ChatGPT。 2022年面世的两个文生图产品改变了人们对AI的能力偏见。一个是DALL·E 2,另一个是Stable Diffusion。两个产品的图片生成水平第一次让业界看到商用可能。此前,业界最优秀的图像生成工具是生成对抗网络(Generative Adversarial Network,GAN),只能生成特定图片— 比如人脸,换成小狗就不行,得重新训练——DALL·E 2和Stable Diffusion没有这种局限性。 不过,尽管这这两款产品都已突破了一些技术瓶颈,但它们关于AI新时代的开启充其量只是报幕员,ChatGPT才是主角,因为只有它解决了语言问题——起码看起来如此。 语言问题的解决意味着新的交互革命。当人们可以用自然语言与机器交流,而机器不仅听得懂这些自然语言,还能与人对话、按照人的话语行事——回答人的问题、画一幅画或者创作一个视频、生成一款游戏——这时候,每个人的电脑、手机上还需不需要安装那么多应用软件就值得重新考虑。也许,只留一个ChatGPT就够了。 以上是一些粗略的概括,关于ChatGPT的重要性,你可以在本期《第一财经》杂志的封面专题文章里看到更细致的介绍。不过,特殊性之外,我们会先后退一步,带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。 在技术对产业的影响方面,几篇封面专题文章会带你看硅谷巨头在AI技术领域的权力更迭,中国头部技术公司对AI大模型领域的探索,生成式AI的具体应用场景,以及对职场人的影响等。 综述 ——AI新纪元 此刻,相信你对无论 ChatGPT还是更大范畴的AIGC到底意味着什么已有足够感知,可能也听过不少业界的溢美之词,比如英伟达创始人黄仁勋称现在为“AI的iPhone时刻”,比尔·盖茨认为AI革命的重要性不亚于互联网的诞生,微软CEO纳德拉则表示这种技术扩散堪比工业革命。 我们打算就此打住,不再过多陈述包括ChatGPT在内的生成式AI可能掀起的产业革命——随后的几篇文章会继续从不同视角讨论它。 这里,我们后退一步。本文带你走到AIGC尤其ChatGPT的背后,看看这些最新出圈的AI明星究竟站在怎样的基石之上。 硅谷 ——微软 vs Google:AI技术的王权更迭 回首过去十余年硅谷围绕人工智能的最前沿探索,在一众伟大科学家的背后,微软和Google的身影始终交织在一起,上演着一轮又一轮技术王权的更迭。 本文带你细致回顾近十五年来两家科技巨头在AI技术领域做了哪些事。 本土 ——中国公司的追赶之旅 如同当年苹果用iPod教训索尼,再用智能手机改写IBM、微软和诺基亚的命运一样,OpenAI的故事看起来似乎是颠覆式创新的典型范式,但它在中国留下的故事版本和在硅谷书写的并不那么相同:在硅谷,技术巨头们都是参赛者;在中国,大厂们只是追赶者。 本文为你介绍国内的头部技术公司,对AI大模型的探索走到了哪一步。 应用 ——生成式AI,都能干点啥? 在创新工场董事长兼CEO李开复看来,以决策式AI为代表的AI 1.0在落地阶段遇到了很大的“瓶颈”,部分是因为它每次的应用和优化都是割裂的,是“孤岛中的AI应用”,人脸识别、智能辅助驾驶、精准广告推送等不同应用间彼此并不能形成有效的“平台”。 而AI 2.0时代最大的颠覆,就在于基础大模型提供的“平台”作用。“AI 1.0就像是发明电,AI 2.0就是电网。”宣布将投身于生成式AI创业大军的李开复这么比喻。 理论上,大部分行业都能找到其应用场景。本文会为你介绍文本、图像、音频三个领域对于AI技术的应用。 职场...
ChatGPT创业,让子弹再飞一会儿
本科论文

ChatGPT创业,让子弹再飞一会儿

深燃(shenrancaijing)原创 整理 | 唐亚华 最近一段时间以来,ChatGPT成了AI乃至互联网领域最大的新风口,它甚至被一些人视为堪比蒸汽机、互联网、手机的颠覆性、革命性的存在。 国内关于ChatGPT的热度也同样持续。百度文心一言率先发布,随后腾讯、阿里也公布正在研发AIGC以及大模型相关技术,华为的“盘古”传言有望对标ChatGPT,前不久360集团创始人周鸿祎也公开演示了其公司的大语言模型。ChatGPT出现之后,中国的互联网科技企业的热情仿佛一夜之间被点燃。 除了巨头公司,不少互联网大佬亲自下场,也为这个赛道添了一把火。美团联合创始人王慧文早已宣布入场,创新工场董事长李开复正在亲自筹组中文版ChatGPT公司,另外阿里贾扬清、搜狗王小川、京东前AI掌门人周伯文都亲自下场,赶赴大模型赛道。 针对ChatGPT乃至整个AIGC(生成式AI)领域的创业投资大热,4月6日,深燃直播间邀请到了英诺天使基金合伙人王晟,氪信科技创始人兼CEO、粤港澳大湾区数字经济研究院计算金融CTO工作室负责人朱明杰博士,就《ChatGPT来了,创业公司的机会在哪里?》这一主题展开了一场深度对话。 以下是直播实录,由深燃编辑整理: 2017年去OpenAI公司参观时,没想到这一天来得这么快 深燃:你是从什么时候开始关注ChatGPT以及整个AIGC行业投资的?怎样提前判定这个领域值得押注? 王晟:我们在上一代AI活跃的十年里已经投了不少优秀的AI项目,有文远知行、推想科技等。 2020年下半年,OpenAI发布了ChatGPT3,这是一个划时代的产品,相比一代、二代有了指数级的跃迁,这就使我们相信未来10-15年是大模型的时代。但是那之后的一段时间里,市场上没有项目可以投,我们一直处在等待中。 深燃:你个人和所在的投资机构重点关注哪些方向?你们在这个领域已经做了哪些布局? 王晟:2022年初,清华大学NLP实验室的孙茂松教授和他的团队出来创业做了语言大模型深言科技,孙老师在国内算是自然语言生成、理解方面泰斗级的人物,我们就出手了。 我们重点关注多模态大模型,例如,我们投的行者AI是聚焦游戏场景,被大家称为游戏行业的“AI四小龙”。 深燃:2017年,你跟真格基金联合创始人王强一起去过OpenAI公司参观考察,你们当时为什么会去这家公司?考察完之后,你的感受是什么? 朱明杰:ChatGPT1.0推出时,我就一直在跟进,我作为从业者一开始反而不太相信它能达到现在的水平,因为难度太大。 去年11月OpenAI发布3.5版本,我试用后太震惊了。联想到2017年我们去参观OpenAI公司时,一群刚毕业的PhD在做汇报,其实每个学计算机的人都能预想到出现今天的状况,但没想到只用了短短的几年,而且是这么一群年轻人实现的。 ChatGPT的出现是新一轮工业革命,是2022年人类世界中最重要的事情。 朱明杰和王强参观OpenAI公司,OpenAI创始人Sam Altman(山姆·奥特曼)正在发言 / 受访者供图 深燃:OpenAI能做出ChatGPT,有什么有利因素? 朱明杰:即便是在美国,ChatGPT的出现也是很偶然的事情,但也有几个必要的因素。OpenAI创始团队具备典型的“天赋与偏执”并存的特质,而且他们是一个很年轻、没有太多包袱的团队,另外还有微软的算力支持、数据与场景支持等因素。 深燃:你们会用哪三个词来形容ChatGPT? 王晟:大力出奇迹、从感知到创造、从知识到逻辑。尤其是它具备了逻辑思维,这是很大的进步。 朱明杰:第一个词我想到的是“弗兰肯斯坦”(Frankenstein)。这是英国作家玛丽·雪莱的一部小说名,这本书也翻译为《人造人的故事》,ChatGPT也是人造人的故事。我们做计算机的人从业之初就是想要做就是这件事,ChatGPT一定程度上实现了这本书里的内容。 另外两个词就是“一本正经”和“胡说八道”。 深燃:目前的ChatGPT有哪些“硬伤”或者风险? 朱明杰:大概是我刚刚提到的“一本正经地胡说八道”,它给的信息如果是误导性的,将会有很大的危害。目前有一些国家因为这个原因在封锁它,但技术是会不断进步的,下一步行业要做的是找到一条合规可控的路径。 具体到我所从事的金融领域,难点在于,如果数据壁垒存在,金融等高敏感领域将无法完全适用,一旦出现问题无法追责。这一问题是永远存在的,通用大模型无法解决这一问题,除非各个细分领域建立专属大模型。 王晟:风险在于,当一个机器具有逻辑思维的时候,它离有情感情绪、自我意识还有多远?这是人类第一次站在造物主的视角去思考自己的未来,我觉得它最可怕的是它产生了情绪或自我意识之后,故意给人错的信息,有可能造成灾难。从业者要考虑的是怎么去做一个有人类价值观的AI。 未来AIGC真正的大场景,可能是我们从来没见过的应用 深燃:现在围绕ChatGPT创业的人很多,作为投资人,据你观察,这些方向大概分哪几类? 王晟:第一,是研发大模型,直接对标ChatGPT,在ChatGPT这类语言大模型之外还可以扩展到图片、视频等领域;第二,是将ChatGPT垂直应用到各个细分领域。 去年底和今年这几个月,尤其是王慧文宣布自带5000万美金下场后,把市场上的团队全都“炸”出来了。现在虽然说是新的大模型和AIGC驱动的时代,但投资的重点方向还是底层基础设施,可是国内有能力做大模型的团队也就十来个。大模型方向的机会,基本是属于巨头公司、少数大厂大牛、科学家、AI领域教授们的。 深燃:有哪些机会适合创业公司? 王晟:在应用场景侧,目前出现的创新项目还比较少。现在的创业场景非常受限于底层的基础设施和想象力。我们刚从移动互联网时代过来,能想到的就是把移动互联网跟AIGC结合,实际上未来AIGC真正的大场景可能是我们从来没见过的应用,就像PC时代没有美团、滴滴、抖音等。现在大家都在说ChatGPT是AI的iPhone时刻,但其实iPhone1是2007年发布的,微信是2011年才出现的,滴滴、拼多多、抖音就更靠后了。 一些真正突破性的应用还需要等基础设施和工具链建设完成,进入到应用场景和商业模式的创新的阶段。如果大家有在应用层做创新类创业的冲动,不如让子弹再飞一会儿。 需要强调的是,以投资人的标准来看,投一个企业是需要它具备成长为百亿人民币估值公司潜力的,以这个为标准,可投的项目不多,但VC不愿意投资,不代表就不是好项目。很多创业创新都对社会、人类有益,而且越来越多的创新发生,真正巨大的创新才会涌现。 比如有一类创业机会是用AIGC解决原有行业问题,把AI当成生产力工具,解决各行业原来的创造问题。比如游戏行业原画师、设计师、插画师不用自己画了,AI能出想法、概念,或者应用ChatGPT去做一些客服、销售工作,节省人力,提高效益。所以大家不要用VC的眼光和标准来要求自己,各行各业现在就可以去毫不犹豫地全面拥抱AI。 英诺天使基金合伙人王晟 深燃:你一般一周要见几个项目,这一波项目里,可投的好项目多吗?有没有看过一些不靠谱的项目? 王晟:对于VC来说,这一波可投的好项目非常少。我见到最多的项目是文生图的生成器,一般都是用Stable...
ChatGPT里的清华人
本科论文

ChatGPT里的清华人

ChatGPT火遍全球时,背后的技术大牛也浮出水面。在最近的一份调查显示,真正在ChatGPT项目中做出贡献只有87人,而这些人里有9位是华人,其中三位都毕业于清华大学。 文|黄幸怡 编|游勇 01 ChatGPT里的清华元素 OpenAI旗下大语言模型ChatGPT的成功让人眼前一亮,更让外界意想不到的是,这个产品不是出自拥有数千名人工智能团队的谷歌或者Facebook,而是仅成立8年只有三百多人的OpenAI。 来自全球各地的顶尖人才为OpenAI和ChatGPT的成功奠定了基础。今年1月,OpenAI创始人及CEO奥特曼透露公司员工人数为375人 ,与谷歌和脸书等科技巨头从事人工智能工作的数千名员工相比,这是一个很小的数字。“我知道我不应该吹嘘OpenAI,我们要感谢我们所有的外包公司为训练模型提供了必不可少的数据。” 而真正在ChatGPT项目中做出贡献的人员,据OpenAI官网显示,共有87人。ChatGPT只是OpenAI其中的一个项目,比如OpenAI之前发布的文本生成图像的大模型DALL-E,两个半月注册人数突破100万,也在人工智能领域备受关注。 在最近一份由智谱研究联合AMiner发布的《ChatGPT团队背景研究报告》中,这群人的显著特征被归纳为了“年纪很轻”、“背景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”几个方面。 智谱研究发布的报告显示,该团队平均年龄为32岁,“90后”是主力军。作为全球人工智能顶尖研发团队,其成员绝大多数拥有名校学历,但也并非“清一色”研究生学历,而是本、硕、博人数相对均衡。同时,其成员大多具有全球知名企业工作经历,其中,从谷歌跳槽而来的有10人,是为其贡献最多人才的外部企业(ChatGPT基于的也是谷歌提出的Transformer模型)。作为应届生直接加入ChatGPT 团队的也有11人,但不论是来自其他企业,还是作为应届生加入的人员,背景都相当“豪华”。 而在技术上,该团队共有包括OpenAI 联合创始人Wojciech Zaremba在内的5人入选了今年“AI 2000 全球人工智能学者”名单。该名单由AMiner 每年推出,评选出全球人工智能 20个细分领域前 100 名最具影响力学者。这意味着,在 ChatGPT 不足百人的团队中,就有 5 人属于全球人工智能各领域顶尖学者,技术积累深厚。 此外,最值得一提的是,华人成为了该团队中一支重要的科技创新力量,共9人,占团队总人数的比例超10%。华人学者欧阳龙更是参与了与 ChatGPT 相关的 7 大技术项目中的 4 大项目的研发,是InstructGPT 论文的第一作者,也是RLHF 论文的第二作者。“可见他是这两个关键技术项目的核心人员。”智谱研究分析称。 在华人团队中,有5人本科就读于中国内地高校,其中3人(翁家翌、赵盛佳、袁启明)均来自于清华大学,并各有1人本科毕业于华中科技大学、北京大学/香港大学。不过,这5人后续均在海外高校继续深造。 其中,翁家翌是ChatGPT团队里最年轻的研发工程师之一。他于2020年从清华大学计算机系本科毕业,进入卡内基梅隆大学攻读硕士学位。在清华期间,翁家翌曾加入清华大学人工智能研究院基础理论研究中心主任朱军领导的TSAIL实验室,并在大三暑假加入加拿大图灵奖获得者 Yoshua Bengio 的实验室,深入开展RL和NLP的研究。其更是一度以本科生身份,成为基于 PyTorch 的强化学习算法库 Tianshou(天授)的第一作者。 清华大学也以3名成员的数量,与卡内基梅隆大学一起,并列ChatGPT团队毕业院校的第7名。排在他们之前的分别是斯坦福大学(14 人)、加州大学伯克利分校(10 人)、麻省理工学院(7 人)、剑桥大学(5...