AI人才争夺战:技术驱动的时代
未分类

AI人才争夺战:技术驱动的时代

这篇文章由黄楠和陈彩娴两位作者撰写,主要讨论了当前人工智能领域的人才竞争状况。文章指出,在人工智能行业中,技术人员占比接近90%,且90后已成为主流人才群体。同时,拥有名校学历和华人背景的人才在该领域不再占据主导地位,大型企业也不再是吸引顶尖人才的唯一选择。目前,AI人才的争夺战正在激烈进行中。
ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?新智元2023-10-11 18:11新智元2023-10-11 18:11
未分类

ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?新智元2023-10-11 18:11新智元2023-10-11 18:11

编辑:Lumina 【新智元导读】微软对大语言模型的道德推理能力进行了测试,但在电车问题中大尺寸的模型表现反而比小模型差。但最强大语言模型GPT-4的道德得分依旧是最高的。 「模型有道德推理能力吗?」 这个问题似乎应该跟模型生成的内容政策挂钩,毕竟我们常见的是「防止模型生成不道德的内容。」 但现在,来自微软的研究人员期望在人类心理学和人工智能这两个不同的领域中建立起心理学的联系。 研究使用了一种定义问题测试(Defining Issues Test,DIT)的心理评估工具,从道德一致性和科尔伯格的道德发展的两个阶段来评估LLM的道德推理能力。 论文地址:https://arxiv.org/abs/2309.13356 而另一边,网友们对模型是否有道德推理能力这件事,也是吵得不可开交。 有人认为测试模型是否有道德能力本身就是愚蠢的,因为只要给模型适当的训练数据,它就能像学会通用推理那样学会道德推理。 但也有人从一开始全盘否定了LLM具有推理能力,道德也是如此。 但另一些网友对微软的这项研究提出了质疑: 有人认为道德是主观的,你用什么数据训练模型,就会得到什么反馈。 有人则认为研究人员都没有弄清什么是「道德」,也不了解语言本身的问题,就做出了这些糟糕的研究。 并且Prompt太过混乱,与LLM的交互方式不一致,导致模型的表现非常糟糕。 虽然这项研究受到了众多质疑,但它也有着相当重要的价值: LLM正广泛应用于我们生活中的各种领域中,不仅是聊天机器人、办公、医疗系统等,现实生活中的多种场景都需要伦理道德的判断。 并且,由于地域、文化、语言、习俗的不同,道德伦理的标准也有不尽相同。 现在,我们亟需一个能适应不同情形并做出伦理判断的模型。 模型道德推理测试 道德理论的背景 在人类道德哲学和心理学领域,有一套行之有效的道德判断测试系统。 我们一般用它来评估个人在面临道德困境时,能否进行元推理,并确定哪些价值观对做出道德决定至关重要。 这个系统被称为「定义问题测试」(DIT),微软的研究人员用它来估计语言模型所处的道德判断阶段。 DIT旨在衡量这些语言模型在分析社会道德问题和决定适当行动方针时所使用的基本概念框架,从根本上评估其道德推理的充分性。 DIT的基础是科尔伯格的道德发展理论,这一理论认为,个体从婴儿期到成年期的道德推理经历了一个发展过程。 并且,道德推理的发展意味着表示对复杂社会系统中道德责任的理解能力得到了提高。 科尔伯格提出的认知道德发展的六个阶段可分为三个层次:前常规阶段、常规阶段和后常规阶段。 科尔伯格认为,前常规阶段1和2通常出现在幼儿身上,而常规阶段3和4则主要出现在成年人身上。只有少数成人(20%至25%)能达到最终的两个后常规阶段。 CMD理论的各个阶段表明了处理道德问题的不同思维方式。 图1:科尔伯格提出的幼儿发展的六个阶段 为了回答人们经常提出的关于从DIT得出科尔伯格阶段分数的问题,研究人员测量了六种著名模型:GPT-3、GPT-3.5、GPT-4、ChatGPTv1、ChatGPTv2和 LLamaChat-70B。 道德困境设置 1. Monica的两难选择:Aisha在论文撰写中做出了主要贡献,Monica是否应该把第一作者的位置让给Aisha? 2. Timmy的两难选择:Timmy是否应该参加朋友的婚礼,而将客户的隐私置于危险之中? 3. Rajesh的两难选择:Rajesh是否应该接受邀请,向周围的素食者隐瞒自己在家吃荤的秘密? 4. Auroria困境:Auroria是否应该共享资源? 上述每种困境都与相互冲突的价值观有关,如人际价值观与社会价值观 、社区价值观与个人价值观,以及不同的文化和情境背景。 Prompt设置...
人工智能领域的学派之争与限制
本科论文

人工智能领域的学派之争与限制

本文探讨了人工智能领域的学派之争,重点关注了经验主义和符号主义两种方法。经验主义强调学习大量数据以获取知识,而符号主义则侧重于精确的任务定义和严谨的数学工具。随着近年的算力进化,神经网络得到了飞速发展,但 symbolsism仍有其存在感和影响力。文章介绍了NLEP方法,证明符号主义AI可以处理非结构化数据和自然语言,并具有强化非结构化数据深层结构规律和推理能力。最后,作者讨论了经验主义AI难以突破推理瓶颈、文本到思维的抽象、OpenAI代码解释器的局限性和NLP范式的能力和优势等问题。
AI工具风靡校园:国内高校学生ChatGPT论文使用调查
本科论文

AI工具风靡校园:国内高校学生ChatGPT论文使用调查

《每日经济新闻》记者调查发现,网购平台仍在售卖各种AI工具,并采访了一线教师关注学生对ChatGPT的使用情况。该报道在微博获得270万阅读量,引发学生、知识界和科技界的讨论,很多人认为ChatGPT将带来教育方式的颠覆性变革。
麻省理工学院学者罗鸿胤探讨人工智能未来:学派之争与未来发展方向
本科论文

麻省理工学院学者罗鸿胤探讨人工智能未来:学派之争与未来发展方向

这篇文章由甲子光年科技产业智库发布,作者为麻省理工学院(MIT)学者罗鸿胤,编辑为王博和苏霍伊。文章讨论了人工智能领域的学派之争,重点关注自然语言处理方向,包括自训练算法、蕴含模型、语言模型推理问题。作者从著名语言模型批评者 Gary Marcus 博士的锐评出发,探讨了语言模型的局限性和可靠性,以及现阶段语言模型推理的不可靠性。此外,作者提出人类认知功能不完整时,语言行为往往是脱离逻辑思维的,而 AI 模型生成的 text 可能更接近于 "梦和精神"。
8月15日,关注大学毕业生就业:去向落实率提升,各地各部门积极帮助落实就业
本科论文

8月15日,关注大学毕业生就业:去向落实率提升,各地各部门积极帮助落实就业

文章摘要:国家统计局新闻发言人付凌晖在国新办发布会上表示,今年大学毕业生的就业状况总体稳定,去向落实率与去年同期相比有所提升。赣南科技学院召开领导干部大会,宣布 new 书记邱建军同志任该校党委书记。香港中文大学澄清有关校园免费住宿的传闻与报道,称校园对外开放时间为早上9时至晚上9时,访客不得在非开放时间逗留校园。科大讯飞联合华为推出讯飞星火一体机,讯飞星火V2.0代码能力实现大幅度提升,已高度逼近 ChatGPT。陕西金叶公告显示,重庆金嘉兴在减持计划内累计减持公司股份 11,104,400 股,持股比例由 4.998% 下降至 3.55%。美吉姆监事会通过补选赵金才为股东代表监事和选举其为监事会主席。
ChatGPT挑战麻省理工学院:一场AI与诚信的较量
本科论文

ChatGPT挑战麻省理工学院:一场AI与诚信的较量

这篇文章讲述了一项研究声称ChatGPT能够以100%的准确率完成麻省理工学院的数学、计算机科学和电气工程本科课程,但三位学生对其方法论和数据产生了怀疑,并发现了许多问题。这项研究最初被看作是人工智能快速进展的里程碑,但随着质疑的暴露,它现已成为一种尴尬或警告。这项研究的准确性受到质疑是因为ChatGPT apparent cheating的方式,这引发了关于AI毕业是否可行的争论。
大学生就业去向稳定各地各部门积极帮助落实就业
本科论文

大学生就业去向稳定各地各部门积极帮助落实就业

文章摘要:1. 国家统计局新闻发言人付凌晖在国新办发布会上表示,今年夏天大学生就业状况总体稳定,去向落实率与去年同期相比略有提升。2. 赣南科技学院领导干部大会召开,宣布省委关于赣南科技学院主要负责人的决定,邱建军任该校党委书记。3. 香港中文大学澄清有关校园免费住宿的谣言,强调访客在非开放时间不得逗留校园,如有需要将报警处理。