文章主题:人工智能大模型, 评测, 创新应用, 行业应用
当我们谈论人工智能时,ChatGPT 的出现无疑是一个革命性的突破,让我们第一次真正感受到了机器的智能之处。然而,现在,我们国家已经启动了“百模大战”,这是一项涉及超过一百个陆续公开发布的人工智能大模型的计划。这些大模型的功能和应用范围之广泛,可能会以我们难以想象的方式,在未来改变我们的生活。因此,我们可以预见,这些即将公开的人工智能大模型将会引发一场技术变革,影响我们将来的生活和工作。
在我国超过一百个人工智能大模型中,我们可以看到通用大模型和垂直大模型的存在。它们各自在未来的生活基础领域和专业竞争领域发挥着重要作用。无论是通用大模型还是垂直大模型,对于它们的智能程度评估以及如何进行修正和改进,都是当前行业内亟待解决的重要且紧迫问题。
在2023年,我国人工智能大模型基准测试科创发展大会与中西部数字经济大会分别在两条赛道上对各行业进行了全面的评估。至12月20日,已有近20家企业的垂类大模型报名参加,这些企业来自金融、教育、电商、医疗等多个领域。在评委专家的严格筛选下,最终有13家企业脱颖而出,成功晋级评委线下答辩环节。
在12月23日的苏州工业园区东沙湖基金小镇元禾辰坤,评委们与13家企业的深度交流正在热烈进行中。现在,我们已经可以根据这些企业的创新应用优秀案例评选出名单,并计划在12月28日的2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会上公布。
多维度评估
综合考量企业的创新能力和发展潜力
与通用的巨大模型相比,专门针对某一领域的垂直模型具有更高的专业性和针对性。要在这些模型上进行评估,不仅需要深入的专业知识,还需要丰富的市场经验。因此,对于垂直大模型的测评,我们需要在专业技能和实际市场经验两方面做好充分的准备。
在10月22日,大模型基准评测专家委员会首次成功地 holds a preparation meeting in Chengdu. During the meeting, experts from the committee engaged in heated discussions around the details of evaluation methods, dimensions, and the scope of evaluation, incorporating various opinions to form the conference testing standards, which represents the first-ever evaluation of vertical large models in China.
在本次评估中,我们综合考察了多个重要维度,以确保全面准确地评估参与评测的项目。这些维度包括:项目团队背景,市场潜力,技术水平评估,商业模式可行性分析,以及融资安排评估等。在考虑这些因素时,我们不仅关注项目团队的行业经验和专业背景,还重点分析了团队成员的分工协作和项目目标的市场需求空间及潜力。此外,我们对产品的技术水平进行了评估,比较了与竞争对手的优势和创新性,并探讨了产业化的可行性。同时,我们还对盈利模式的可行性和可持续性进行了深入研究。最后,我们还对项目的投资计划和进度安排进行了合理性分析。
在线下答辩过程中,我们采用了一种独特的评分方式,即评委现场评估打分。这种方式的特点在于,决赛评委们将亲自到现场,对参评企业进行详细的评估和打分。具体来说,每位主席以及多名技术专家、企业专家和投资人将共同组成决赛评委团,针对每个参评企业进行评分。为了确保公平公正,我们将计算截尾平均分数,以此作为评价企业表现的重要依据。经过激烈的角逐,我们最终能够确定哪些企业脱颖而出,成为此次垂直大模型创新应用的优秀案例。
参与此次垂直大模型创新应用优秀案例的评选专家,既有来自人工智能行业的资深工程师与专家学者,又有来自创投和咨询行业的专业人士。他们分别从各自行业出发,多维度评选出更符合行业需求的垂直大模型应用优秀案例。
以下是此次垂直大模型创新应用评测评委(排名不分先后):
【天津大学“语言智能与技术”中外联合研究中心主任、智能与计算学部教授 熊德意】
【中国软件评测中心(工业和信息化部软件与集成电路促进中心) 梁斌】
【上海交通大学约翰·霍普克罗夫特计算机科学中心 林洲汉】
【郑州大学计算机与人工智能学院 昝红英】
【驰星创投董事总经理 李一心】
【德勤中国资本市场服务部上市业务华西区主管合伙人 刘洋】
各领域垂直大模型齐聚一堂
多维度评测交流助推行业进步
中国软件评测中心(工业和信息化部软件与集成电路促进中心)梁斌告诉红星新闻:“参与此次垂直大模型答辩评审会,我最大的感受是各行各业垂直领域大模型都在蓬勃发展。这些企业对于大模型的行业应用探索都很深入,但是针对自身大模型的检验检测技术的重视程度还需加强。在参与答辩的13家企业中,上海财经大学金融大模型实验室团队不仅开发了FinEval金融大模型,还同步构建了评估金融大模型的‘评测数据集’。这是一个让我觉得特别亮眼的地方。我认为无论是垂直还是通用的大模型,在发展大模型行业应用的同时,还应关注到相应大模型的检验检测技术。这两者要如同矛与盾,相克相生,才能共同成长。”
驰星创投董事总经理李一心向红星新闻表示:“这次参与的垂直大模型应用方向涵盖了包括金融、工业、法律、医疗、营销和零售等在内的各个场景。基础大模型在知识复刻的商业生态中,占据了核心位置,短期来看还有Scale-Up的可能性。而对垂直大模型公司来说,重要是找准差异化的生态位置,抓住AI创造的增量价值,即便是GPT4这种水平的多模态模型离直接应用都还有比较远的距离。数据壁垒、模型finetune水平和工程能力都会是创业公司的机会。”
截至发稿,此次垂直大模型创新应用优秀案例名单已经产生,该名单将为市场提供多元、客观的垂直大模型性能评估,促进行业创新,共同推动人工智能技术进步。让我们共同期待12月28日,该名单在2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会上揭晓。
以下是此次参与答辩的企业及大模型产品(排名不分先后):
1 摸象科技:金磐大模型 (零售金融行业)
2 达观数据:达观曹植大语言模型 (金融行业)
3 微盟集团:微盟WAI (电商行业)
4 赛灵力:实时数字互动人
5 左手医生:GPT诊前服务(智能云客服行业)、专家数字分身(医疗行业)
6 得理科技:得理法律大模型(法律行业)
7 极睿科技:ECGPT+FashionCLIP(电商行业)
8 中科闻歌:雅意2.0(媒体、舆情、金融等行业)
9 北京交通大学交通大模型团队:多模态交通大模型(交通领域)
10 晓多科技:晓模型XPT(电商行业)
11 上海财经大学金融大模型实验室团队:FinEval (金融行业)
12 考拉悠然:悠然产业通用大模型(企业服务)
13 盛世君联:干湿试验结合的大分子AI药物研发平台BioAI(生物医药行业)
红星新闻记者 程璐洋 彭运
编辑 余冬梅
(下载红星新闻,报料有奖!)
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!