【高端访谈】嘉实基金孟夏:ChatGPT不断迭代升级,文心一言正式亮相,A股将如何掘金新技术颠覆性变化的投资机会?
研博论文

【高端访谈】嘉实基金孟夏:ChatGPT不断迭代升级,文心一言正式亮相,A股将如何掘金新技术颠覆性变化的投资机会?

本文共3324字 阅读完约6分钟 金融投资报记者 张璐璇 去年11月以来,ChatGPT等新技术的推出,在世界范围内激起前所未有的对人工智能的讨论热潮,资本市场随即演绎了一波行情。 美国时间3月15日凌晨,OpenAI宣布ChatGPT升级为算力更惊人的GPT-4。北京时间3月16日下午,国产版的百度“文心一言”正式面世,这些再度引发社会热议。 随着人工智能技术的不断升级,将对全社会和相关产业带来怎样的深远影响?我国在人工智能方面的技术水平如何?A股在人工智能领域的掘金机会有哪些?带着这些问题,金融投资报记者采访了嘉实基金的基金经理孟夏先生。 孟夏 嘉实优势成长混合、 嘉实领先成长混合基金经理 记者提问能谈谈ChatGPT技术给当今社会带来的进步或颠覆体现在哪些方面? 孟夏:AI从原理上讲,是海量数据打上标签喂给机器,不断训练机器,最终让它给出正确的推理。在传统的编程中我们输入的是数据与规则,也就是给出一个X和关于X的函数,让机器输出一个Y,而AI是给机器很多个X和很多个Y,最终让AI学习出其中的规则。 ChatGPT其实就是微软推出的一款人工智能技术驱动的自然语言处理工具,也是AIGC(AI-Generated Content,人工智能生成内容)技术进展的一个体现,称得上是人工智能技术、算力和数据三项条件日渐成熟的产物,拥有强大的信息整合能力、自然语言处理能力,能根据要求进行聊天、可以生成游戏剧本、编写程序代码,以及进行文学、媒体相关领域的创作,包括创作音乐、诗歌等,它的面世,给相关领域带来了前所未有的惊喜,更长远地看,则是更多的机遇与挑战。 以GPT-3为例,其训练模型数据以及使用规则达到45TB的全互联网文本,具有1750亿个参数,算力相当强大。而最新公布的升级版GPT-4,文本量和参数更是上升到了一个惊人的新高度,它比之前的版本具有更强大的识图能力,文字输入限制提升至2.5万字节,回答准确度显著提高,能够生成歌词、创意文本,还能够实现风格变化等。 记者提问当下,美国微软推出的ChatGPT技术处于世界的领先水平,请问,中国在这个领域的技术如何?中国追赶世界人工智能最前沿技术的条件或优势在哪些方面? 孟夏:今年2月份由ChatGPT支持的最新版本搜索引擎和浏览器升级更新;近日Windows 11再次更新——将新版AI搜索添加到任务栏中。3月15日,OpenAI又正式宣布ChatGPT升级成算力更惊人的GPT-4。毫无疑问,这些都是领先于世界的最新技术。 目前,全球还没有能跟ChatGPT抗衡的大模型,我国虽然多个机构和企业发布了一系列大模型,但相比ChatGPT仍有一定差距。因为ChatGPT需要更高算力的芯片、更高效力的算法、更庞大的数据,我国的差距主要体现在高算力的芯片和高效力的算法两个方面。业界共识是这个差距在两年以上,但我们认为,中国的实际差距可能并没有那么大,预计是在一年左右。 据中国科学技术信息研究所报告,包括算法在内的中国人工智能地位和GDP排名是相符合的,总体约排在第二的位置。另有报告显示,2022年全球半导体专利申请数量达到了创纪录的69190项,其中,我国半导体专利申请量达到了37865项,占全球总量的55%,遥遥领先其它国家。 算力、算法、数据是人工智能的三要素。其中,算力称得上是算法和数据的基础设施,其大小决定了数据处理能力的强弱。因此,算力产业需求广阔,“东数西算”工程正式启动之后,算力逐步赋能千行百业,包括人脸识别、自动辅助驾驶系统、地质勘探、高端制造等。 据测算,算力如果每投入1元,将带动3元-4元的经济产出。2021年,我国算力产业规模达到2.6万亿元,直接和间接分别带动经济总产出2.2万亿元和8.2万亿元。另有统计,我国算力总规模近5年年均增速超过25%。 记者提问近日百度推出“文心一言”,被业界称为中国版的ChatGPT。您认为,这些人工智能技术将给中国社会、经济及百姓的生活,带来哪些可见的变化?或深远影响? 孟夏:我们也关注到,自2月份百度官宣“文心一言”以来,已经有超过650家企业宣布启动接入“文心一言”生态,参与其全面测试、体验与业务深度合作,涉及金融保险证券、媒体、汽车、互联网等行业。 在3月16日下午举行的新闻发布会上,百度方面展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。从现场展示来看,“文心一言”某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。 我们认为,随着人工智能不断赋能经济社会各领域,新技术将日渐成为科技跨越发展、产业优化升级、生产力整体跃升的新动能,这将有助于促进提高全要素生产率,推动经济高质量发展,带来社会巨变的同时,也改变了人们的生产生活方式。 据中国信通院预计,2022年我国人工智能核心产业规模(增加值)达到5080亿元,同比增长18%。相信,未来这一领域的发展空间不可估量。 记者提问一般地,新技术的浪潮都会在资本市场率先得到体现,您如何看待去年底以来的A股这一波ChatGPT相关行情? 孟夏:投资需要往前看,更多是投资未来,此轮A股与ChatGPT相关的行情更多的是基于市场或投资者对其前景看好的预期。整体看,ChatGPT距离大规模应用落地还有一段距离,这个过程更多会充满曲折。 其实,ChatGPT等工具算力再厉害,其实仅是提供了一种模型的框架,具体在各行业要取得专业化的实现应用,还有一段很长的路要走。如果将ChatGPT比作为一个人在高中必须具备的基本社会生存技能的话,他还需要继续在大学、在研究生阶段,去接受了各行业更专业的技术和技能培训,才能真正适应社会方方面面的真实需求。 在参与ChatGPT概念的投资时,投资者还是要保持冷静,正视风险是和机遇并存的。投资者对国内类ChatGPT相关的企业的评判,也要区分真伪和参与程度的高低。 记者提问目前,A股中的公司与ChatGPT或“文心一言”相关的企业关联度紧密吗?在哪些领域的企业会涉及或受益于这些新技术的推广或深化?投资者将如何把握相关投资机会? 孟夏:ChatGPT技术仍处于进化阶段,大规模商业应用还需要不断探索和验证,建议投资者关注因为需求持续释放而受益的算力板块,以及因为数字经济发展受益的数据要素板块。任何新兴事物的崛起过程都不会一帆风顺,尤其是像ChatGPT技术这样高精尖的前沿科技领域,波动性更是在所难免。 对于投资者来说,相关的资金和专业、技术等门槛都较高,因此,建议还是将专业的事交给专业的人来做,可以借道公募基金等专业投研力量来参与分享新技术带来的投资盛宴。 单位及嘉宾简介 嘉实基金 嘉实基金成立于1999年3月,是国内最早成立的十家基金管理公司之一,现已发展成为具有“全牌照”业务的综合性国际化资产管理集团。目前,管理资产总规模超过14500亿元,公司成立以来,累计服务1.18亿个人投资者、8000多个机构投资者,共创造基金回报超过2100亿元。 孟夏 嘉实优势成长混合、嘉实领先成长混合基金经理。CFA,复旦大学金融学学士、硕士。2014年7月加入嘉实基金,2018年任研究部制造组组长,2020年7月22日起任嘉实优势成长基金经理,2022年11月2日起任嘉实领先成长基金经理。 孟夏擅长高端制造、软硬科技、平台型服务业、消费和医疗制造、专精特新等领域投资研究,坚信“长期可持续收益的唯一来源是优秀企业持续成长创造的价值”,希望通过深度研究、持续跟踪,“聚焦顶级的企业,发掘长期的成长”,成为长期业绩优秀的底仓型成长基金经理。 编辑|贺梦璐 本文为|金融投资报jrtzb028(微信号)| 未经授权,禁止转载 如需转载,请联系金妹儿 转载须在正文开头显著位置 注明稿件来源及作者名,违者必究互联网新闻信息服务许可证号:51120180008
ChatGPT爆火,带飞这家上海公司
研博论文

ChatGPT爆火,带飞这家上海公司

记者|杨松 编辑|谭璐 “2023年,我觉得是人工智能进入新阶段的一个起点。” 提及当下大热的ChatGPT,达观数据董事长、CEO陈运文兴奋地告诉《21CBR》记者,其写出来的内容,相较之前的计算机写作有了质的飞跃,写作能力已经超过了普通人。 陈运文觉得,ChatGPT与自己的创业项目,有“非常强的相关性。”达观对文本进行智能化处理,与ChatGPT本质上是一致的,都使用到了自然语言处理技术。 人工智能技术主要应用在三个方面,语音识别、图像识别、自然语言处理。前两个领域进展迅速,已经上市的商汤、科大讯飞等公司,业务均集中在图像、语音方面。 2008年从复旦大学博士毕业后,陈运文的工作一直围绕着“人工智能”和“文本”,先后担任盛大文学首席数据官、腾讯文学高级总监、百度核心技术研发工程师等职务。 2015年,陈运文创办了专注于智能文本机器人公司达观数据。创业初期,他组建了一个算法团队,参加全球算法竞赛,两次获得世界冠军。 经过7年技术研发,达观首创了国内第一套文本智能处理IDP处理平台,行业无锚点OCR文字提取系统,以及独家开发RPA(机器人流程自动化)文字元素自适应穿透捕获算法。 产品应用方面,达观的业务已遍布金融、制造、政务等细分领域。 天眼查显示,2022年3月,达观数据完成C轮5.8亿元融资,投资方包括中信证券、招商证券、广发证券、中信建投等券商,累计融资额超过10亿元。 陈运文透露,今年公司的营收有望超过历史上任何一年,预计会完成新一轮融资。 以下为陈运文自述: 加速研发 ChatGPT所运用的技术原型,在2017年就诞生了,我们叫做Transformer模型,既可以用来做文档资料的阅读理解,也可以用来写作。 我印象中人工智能上一次这么热,还是2016年AlphaGo下围棋。6年之后又有一个非常巨大的技术突破,挺鼓舞人心的。 行业内有句话,自然语言理解,是人工智能皇冠上的明珠。我之前估计,人工智能的水平超过人类,需要5-10年,现在时间进程大大加快。2023年人工智能进入一个新的阶段,标志着新时代的开始。 ChatGPT背后的大模型技术,是通过海量文档资料进行深度学习,智能程度已经达到非常高的水平。不仅能直接给出选择题的答案,还可以帮用户写代码、找bug,写各种各样的文档资料。 大家对人工智能的未来前景也越来越乐观,以前觉得人工智能做不了的事情,接下来会一点一点实现,超过人类的相应能力。 达观所从事的研究领域,是文档资料的智能处理,与ChatGPT的工作原理类似。 达观的产品则应用在企业级领域,面向更为垂直的行业。 不过,通用大语言模型与专用模型,有很大差异。如果用户问ChatGPT一些专业性问题,还是会发现它的回答可能东拉西扯,说不到重点或不够深刻。 我曾问过关于自然语言处理领域特别专业的技术知识,它的回复不太好。在垂直领域,还是需要类似达观所提供的专用语言模型。 在自然语言处理领域,OpenAI(ChatGPT背后的公司)的模式已经走通,我们可以跟随,并在垂直领域做得更好,未来会有非常优秀的国产语言大模型。 达观在2021年建立了一个专家工作站,与复旦大学计算机科学技术学院教授黄萱菁合作,她也是国内自然语言处理领域的知名专家。 今年,达观和复旦大学联合实验室的重点任务,在AIGC(AI Generated Content,利用人工智能技术生成内容)领域,争取推出优秀的成果。 ChatGPT的大热,也给我们研发团队更大的压力。以前觉得技术没那么快成熟,而美国同行做出了这么优秀的产品,我们需要加速研发进度。 我自己是研发出身,现在也是管研发更多一些。时不我待,近期研发同事都在加班。我对达观今年的研发期望很大,希望在专用语言模型和知识图谱方面均有所突破。 行业样本 过去几年,我们围绕文档资料处理,研发了很多相关技术和产品。 比如,针对文档扫描环节,我们开发了达观OCR(文字扫描)相关平台;推出模拟重复性操作文档资料的RPA功能模块,不管是纸质还是电子版的文档资料,达观平台都能处理。 针对不同行业,我们在研发产品时,需要行业内大量专有语料数据,对系统进行强化训练。 达观招聘了很多垂直行业的业务专家,也跟行业领先的公司合作,比如,和很多金融行业的头部银行、证券公司合作,将业务专家的专业知识引入语音模型中,让系统拥有专家能力。 金融行业的文书工作很多,比如各种信贷报告、招股书、研报等,需要大量的文档处理工作,且对准确率要求高,AI系统非常有优势。 这个领域的人才成本比较高,期望利用AI系统提高效率,达观产品内嵌到金融公司内部的作业系统中,几乎是员工日常工作的标配工具。比如银行的流水核查,甚至更复杂的财报中数据出现矛盾,通过系统都能鉴别出来。 计算机处理文字资料的效率,大概是普通白领员工的100倍,可以24小时工作,对很多行业来说是非常有价值的。例如进出口企业,海外订单可能是半夜才到,需要系统立即处理,而不是等到第二天员工上班才去处理。 证券领域,前30大券商都是达观的客户。其中4家头部企业在几年前已经使用产品,后来也成为了我们公司的股东。 行业类产品,从研发到成熟到大规模复制普及,整个过程需要一定周期性。达观通常从市场容量高的行业优先切入,目前布局了金融、制造等板块。 在自然语音处理领域,国内外有很多大平台,比如百度、谷歌都有多年积淀。互联网巨头未来可能会推出面向个人用户端的通用语言大模型,而类似达观这类TO B初创公司,则专注于垂直领域的专用大模型,会有一个差异化发展路径。 在文档资料领域,除了审核还有写作环节。智能化写作将是达观重要的技术突破点,完成之后就能形成产品闭环。 万亿市场 在去年的艰难环境中,我们是AI行业增长最快的公司,团队做了很多努力,挺不容易的。 今年整个经济形势及市场信心回暖得非常快,我觉得今年的收入和业务发展,应该超过公司历史上任何一年。...
复旦清华联合顶刊发文|ChatGPT:潜力、前景和局限
研博论文

复旦清华联合顶刊发文|ChatGPT:潜力、前景和局限

来源:信息与电子工程前沿FITEE 作者:周杰 柯沛 邱锡鹏 黄民烈 张军平 编辑:好困 【新智元导读】为更好地理解ChatGPT,这里我们简要介绍其历史,讨论其优点和不足,指出几个潜在应用,最后分析它对可信赖人工智能、会话搜索引擎和通用人工智能(artificial general intelligence, AGI)发展的影响。 最近,OpenAI发布了对话生成预训练模型Transformer(Chat Generative Pre-trained Transformer,ChatGPT)(Schulman et al., 2022),其展现的能力令人印象深刻,吸引了工业界和学术界的广泛关注。这是首次在大型语言模型(large language model, LLM)内很好地解决如此多样的开放任务。 ChatGPT成为历史上增长最快的消费者应用程序,在发布后两个月内,吸引了1亿月度活跃访客(Hu,2023)。自发布以来,因其高超的对话能力,已引爆社会关注。它可以回答后续提问,拒绝不当请求,挑战错误前提,并承认自己错误(Schulman et al., 2022)。它获得许多涌现能力,如高质量对话、复杂推理、思维链(CoT)(Wei et al., 2022b)、零/少样本学习(语境学习)、跨任务泛化、代码理解/生成等等。 论文地址:https://link.springer.com/article/10.1631/FITEE.2300089 这些令人印象深刻的能力,ChatGPT是如何获得的? 其主要得益于大型语言模型,它利用语言模型(LM)在大规模数据上训练巨大的神经网络模型,如Transformer(Vaswani et al., 2017)。语言模型旨在根据上文预测下一个词的概率,是文本中的自监督信号。 互联网上存在大规模文本数据,所以通过语言模型对模型进行预训练是顺理成章的。现有研究表明,模型规模和数据量越大,性能越好。当模型和数据规模达到一定程度时,模型将获得涌现能力。 例如,OpenAI发布的GPT-3(Brown et al., 2020)有1750亿个参数。它的预训练采用超级计算机(285 000个CPU,10 000个GPU)在45 TB文本数据上完成。 而模型也由此在零样本学习任务上实现了巨大性能提升,具有小模型所不具备的语境学习能力。随后,更多策略——如代码预训练(Chen et al., 2021)、指令微调(Wei...
文心一言开启邀测,专家呼吁多点耐心,给中国类ChatGPT更多成长机会
研博论文

文心一言开启邀测,专家呼吁多点耐心,给中国类ChatGPT更多成长机会

距离新一代人工智能语言模型GPT-4发布不到24小时,国内互联网大厂百度3月16日发布了对标ChatGPT的AI产品——文心一言。 尽管百度创始人兼董事长李彦宏一上台就“降了音调”,表示推出文心一言是为了回应市场期待,产品本身并不完美,但仍然无法降低网友心中早已被拉满的期望值。 文心一言开启邀请测试不到一小时,就涌入了3万多家企业申请。而从2月7日官宣预告到邀请测试,中间隔了37天。毫无疑问,文心一言的推出为竞争已近白热化的自然语言处理赛道再添一缕硝烟,也意味着ChatGPT全球赛开场。近期,国内还有数款类ChatGPT模型将要发布,面对差距,国内产品应该如何追赶“国际顶流”?专家呼吁国内用户多一些耐心与真诚参与,给尚不完美的模型提供高质量的数据反馈。 全球首款实现多模态输出的类ChatGPT产品 3月16日下午两点,万众瞩目的邀请测试展示如期召开。李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。 上海交通大学计算机系专攻大语言模型方向的博士生陈星宇全程观看了发布会。在他看来,整场演示内容流畅,亮点不少,达到了他的预期。而演示最出彩之处当属文心一言将一段文本生成了图片、音频和视频,这是全球发布的产品级大语言模型中首个实现多模态输出的模型——即使是前一天发布的GPT-4,也只展示了多模态输入功能。 多模态输出意味着什么?陈星宇表示,目前尚没有一篇正式出版的文章介绍多模态输出是如何实现的,这属于百度自己的“独门秘籍”。据他猜测,应该是百度整合了多个不同类别的大模型的结果。而要把这些模型无缝整合到一个对话系统中,并实现流畅输出,其中有很多工程技术难题需要解决,比如优化。“百度在这方面做得很好。”他说。 仅从演示看,陈星宇认为文心一言达到了类ChatGPT的水准。但遗憾的是,演示并非实时,这也让不少欲亲自参与测试的网友大呼“不过瘾”。 人类“循循善诱”,才能让机器输出更好答案 此次,文心一言没有开放大规模公众测试,而是采用发放邀请码的方式邀请小部分用户参与体验。对此,部分网友表示不理解。 但在业内人士看来,这其中有更深层次的考量。“现阶段的文心一言,更需要有明确任务的使用者,而非打发无聊时光的对话者。”陈星宇说。 试想一下,当你把语言模型当成生产力工具,让它帮助你完成一项工作时,如果它输出的内容不能满足你要求,你可能会尝试改变提问的角度或输入更多有价值的信息,以便让答案更符合你的预期。而当你只是想聊天时,或许就没那么认真了,你输入的内容也许漫不经心,也许有些小错误,甚至你还会暗自期待它犯错。 事实上,最新发布的GPT-4演示也证明了人类的“循循善诱”是如何让机器输出更完美答案的:演示者通过让GPT-4代入某种角色,并交代了四个回答问题的步骤,教会他产出令人满意的回答。 复旦大学计算机学院教授、深耕人工智能和自然语言处理20余年的黄萱菁表示,高质量的语料库和优质的人类反馈,是造就ChatGPT优异表现的两大关键因素。对于其所在实验室正在训练的类ChatGPT模型MOSS,他们也将通过更高质量的中文数据进行性能优化。 多一点耐心,给中国类ChatGPT更多成长机会 当下,生成式人工智能的表现虽然令人惊艳,但远未达到完美无缺的程度。即便是大受褒奖的GPT-4,在其公布的报告中也坦言,他们仍然无法彻底解决大语言模型的幻觉问题。相比ChatGPT,GPT-4回答事实性问题的准确率已达到80%,ChatGPT只有60%。 想要通过大语言模型得到令人满意的答案,耐心必不可少。一位网友反映,他用了8个问题引导,才让ChatGPT给出了勉强令人满意的答案。 上海交通大学计算机系助理研究员陈露透露,在类ChatGPT赛道上,中国已拥有许多不亚于文心一言规模的大语言模型,如浪潮的“源”、华为的盘古、阿里巴巴的PLUG,腾讯、字节等互联网大厂也有未公开的模型。“这条赛道,中国并非没有机会,但需要给它们更多成长空间。” 自今年2月百度官宣文心一言以来,已有超过650家企业宣布接入文心一言生态。随着大批由任务驱动而产生的高质量数据的涌现,文心一言将在与用户的互动与反馈中快速学习和成长。 “ChatGPT的成功表明,人工智能已经找到一条对的路。既然路走对了,迭代速度将是很快的。”黄萱菁说。以应用为驱动的人工智能,将通过真实用户反馈、开发者调用和模型迭代之间的飞轮快速进化,或许今天尚显稚嫩的模型很快就能达到“士别三日,当刮目相看”的效果,但眼下我们需要的仍是耐心与宽容。 作者:沈湫莎 责任编辑:任荃 *文汇独家稿件,转载请注明出处。 举报/反馈
中国版ChatGPT来袭!打破壁垒,引领中文NLP革命?🔥
期刊论文

中国版ChatGPT来袭!打破壁垒,引领中文NLP革命?🔥

复旦大学发布的中文版ChatGPT,联合上海交通大学研发,名为“中文知识新闻社”,是一种能处理海量中文信息、生成高质量内容的人工智能模型,特别适应中文场景和自然语言处理。该技术在客服、翻译、信息分析等领域应用广泛,标志着中国在人工智能领域的突破,并可能推动科技革命和经济社会发展。尽管与英文版ChatGPT存在语料库、训练数据和应用场景的差异,通过针对性优化和政策支持,有望成为中文AI领域的重要创新力量。
ChatGPT,你的考研导师吗?一问到底,专业解答!
研博论文

ChatGPT,你的考研导师吗?一问到底,专业解答!

ChatGPT以其在考研问题上的详尽信息和实用建议,成为了考研人的热门咨询工具。它建议应用统计专业虽卷,但还需考虑个人背景;学习茆诗松教程需要数学基础,提供系统学习路径;研究生择校时既要明确目标,也要关注课程设置和个人需求。尽管ChatGPT反应快速,但在某些实际问题上,个人经验与专业知识仍不可替代。
ChatGPT开启新纪元?理解它带来的伦理挑战与开放性冲击
本科论文

ChatGPT开启新纪元?理解它带来的伦理挑战与开放性冲击

随着ChatGPT的崛起,人们面对人工智能带来的伦理和社会挑战。文章探讨了技术颠覆性创新如何促使我们重新审视人工智能的潜在风险和价值问题。作者指出ChatGPT通过深度学习和RLHF展示了强大的自然语言理解和生成能力,突破了传统对智能与人工智能的认知,并质疑了某些理论预期。然而,这也暴露出理论思维与工程实践之间的认知差距,引发了关于通用人工智能标准和测试方法的讨论。本文旨在促使人们对人工智能进行全面而深入的理解,以应对这一领域带来的开放性挑战。
ChatGPT风潮下,教育与未来何去何从?学术伦理,教师角色新挑战
研博论文

ChatGPT风潮下,教育与未来何去何从?学术伦理,教师角色新挑战

本文关注了OpenAI研发的聊天机器人ChatGPT在全球范围内引发的关注和讨论。随着其强大的功能(如撰写邮件、论文等)以及破亿活跃用户,教育界担心可能影响学生作业和学术诚信。专家们认为教师需要转变教学策略,培养学生的创造力和批判性思维,同时教育评价体系也需要适应新技术的挑战。ChatGPT的普及也引发了对未来教育方式和教师角色的反思。极简版:ChatGPT引发全球热议,教育界担忧其可能影响学术诚信,教育工作者需调整教学方法以应对技术变革。