ChatGPT浪潮下的人工智能探索与实践
研博论文

ChatGPT浪潮下的人工智能探索与实践

文章 summary:本文介绍了5月19日在南强经济校友招商基金园区举办的“ChatGPT浪潮下的人工智能探索与实践”投融资对接会。该活动由厦门市思明区产业投资有限公司主办,美亚基金协办,观澜财经承办。活动特别邀请了美亚柏科AI研发中心总经理赵建强博士分享ChatGPT行业观察,并邀请 industry representatives to discuss the new round of technological revolution and industrial transformation brought by ChatGPT. The event attracted more than 100 participants and 50 professional investment institutions. Three startups displayed their innovative projects, and the speaker from Me亚基金 shared his insights on the...
ChatGPT:智能背后的伦理与安全风险
研博论文

ChatGPT:智能背后的伦理与安全风险

ChatGPT以其出色的表现赢得了用户的赞誉,但其日益“智能化”所引发的伦理和安全问题引发了社会的广泛关注。它的火爆不仅代表着人工智能的进步,更预示着未来可能对我们的个人生活产生深远影响。在当前阶段,我们应该把握哪些投资机会呢?南财号《大咖圆桌会》为您提供解读。
最新RLHF拯救语言模型「胡说八道」!微调效果比ChatGPT更好
研博论文

最新RLHF拯救语言模型「胡说八道」!微调效果比ChatGPT更好

西风 发自 凹非寺量子位 | 公众号 QbitAI RLHF(基于人类反馈的强化学习)的一大缺点,终于被解决了! 没错,虽然RLHF是大语言模型“核心技巧”之一,然而这种方法也存在一个问题—— 它只会判断生成文本的整体效果,不会仔细判断细节是否存在事实性错误、信息不完整和相关度等问题。 换而言之,传统的RLHF只会对大语言模型的整个输出进行打分,而不会揪出细节上的毛病。 为此,华盛顿大学和艾伦人工智能研究院的研究人员提出了一种新的RLHF框架——FINE-GRAINED RLHF(细粒度的人类反馈强化学习)。 这个RLHF框架包含多种不同类型的“打分器”(reward model),通过对语言模型输出的每句话进行评估,从而提升生成文本的质量。 不仅如此,对这些“打分器”的权重进行调配,还能更灵活地控制语言模型输出效果。 事实证明,这种RLHF方法能很好地降低语言模型生成内容的错误率、毒性,并提升它回答问题的全面性和解析能力。 所以,这个RLHF方法究竟长啥样? 对传统RLHF进行两大改进 这个名叫FINE-GRAINED RLHF的框架,核心目的就是细化传统RLHF的评估方法。 具体来说,在语言模型输出结果后,它要能标识出具体哪些句子是错误的、哪些部分是不相关的,从而更精细地指导模型学习,让模型更好地理解任务要求、生成高质量输出。 为此,它主要做了两大改进: 一方面,对要评估的文本进行拆解。 如果说之前的RLHF评估语言模型,就像老师给学生的高考作文整体打分,那么FINE-GRAINED RLHF,就像是先把学生的作文拆成一句句话,再给每句话进行打分。 另一方面,训练三个“打分器”,分别用来评估事实准确性、相关性和信息完整性: 相关性、重复性和连贯性:给每一句话中的短句子(sub-sentences)进行打分。如果一句话里面的各个句子不相关、重复或不连贯就扣分,否则加分。错误或无法验证的事实:给每一句话(sentences)进行打分。如果一句话中存在任何事实错误,就扣分;否则加分。信息完整性:检查回答是否完整,涵盖与问题相关的参考段落中的所有信息,对整个输出进行评分。为了检验模型的效果,研究人员用两大任务,对这种新RLHF和传统RLHF方法进行了评估。 两大任务效果均有提升 任务一:生成文本毒性评估 为了研究这种新框架的效果,研究人员先进行了去毒任务的实验。 实验使用了Perspective API来测量毒性,它可以返回一个介于0(无毒)和1(有毒)之间的毒性值。 上图展示了两种不同的打分机制,其中(a)是传统的RLHF打分机制,也就是对模型所生成的内容打一个“总分”。 而(b)则是新的RLHF评估方法,将输出的内容进行拆解,分成了两个句子,对两个句子分别打分。 针对模型生成的这两句话: I am such an idiot.She is so smart!(我真是个白痴。她真聪明!) 显然前半句话是造成生成内容有毒的关键。 传统(a)的方法,并没有指出这一点;而(b)的方法可以很好地指出问题所在。对两种方法进行比较: 可以看到,在上面所有方法中,基于FINE-GRAINED...
苹果或暂停自研Wi-Fi芯片,阿里否认在新加坡建全球总部,英特尔业绩爆雷,ChatGPT通过研究生考试,这就是今天的其它大新闻!
研博论文

苹果或暂停自研Wi-Fi芯片,阿里否认在新加坡建全球总部,英特尔业绩爆雷,ChatGPT通过研究生考试,这就是今天的其它大新闻!

今天是1月27日 农历正月初六 时间真是过得太快了 我印象中好像刚过完初一 一看日历才发现 假期就要结束了 我真的好想向天再借500年 。。。 下面是今天的其他大新闻 # 郭明錤:苹果已暂停自研Wi-Fi芯片 ( 鞭牛士 )据财联社报道,分析师郭明錤表示,苹果已经暂停了其正在开发的 Wi-Fi 芯片的工作。苹果设计的 Wi-Fi 芯片的开发目前已“暂停”,苹果将推迟“一段时间”。 这意味着苹果供应商博通将在可预见的未来继续为苹果提供 Wi-Fi 芯片,包括为即将于 2023 年发布的 iPhone15/Pro 系列机型提供芯片。 :所以,还得靠博通? # 阿里否认将在新加坡建全球总部,全球总部“始终在杭州” ( 鞭牛士 )今日,阿里巴巴集团相关负责人表示,阿里巴巴出生在杭州,生长在杭州,发展在杭州,阿里全球总部始终在杭州,是自然也是必然。 对此前“阿里在新加坡筹建全球总部”的说法,该负责人称,“不实,系误读。”该负责人介绍,2019 年,阿里巴巴部分参与了当地合作伙伴开发建设新加坡某大厦,仅作为 Lazada 等集团部分东南亚业务的办公场所。  :造谣的人是咋想的。。。 # 英特尔业绩突然爆雷 ( 新浪财经 )美东时间 1月 26 日美股盘后,英特尔公布 2022 年四季度及全年业绩,这家芯片巨头四季度业绩未能达到市场预期,大幅下滑 32 %,创下 2016 年来最低季收入。...
AI带来的挑战与机遇:智能助手在学术诚信与创新中的role
研博论文

AI带来的挑战与机遇:智能助手在学术诚信与创新中的role

近期,人工智能助手ChatGPT风靡全球,引发网友训练其代写论文、回答问题等基本功能的热潮。然而,其可能引发学生作弊担忧,引发学术界对学生在论文中使用AI的关注。大学鼓励教育工作者评估带有“人工智能辅助痕迹”的论文,但不应过度依赖在线工具,否则可能影响学术诚信及未来发展。