京东凭AI技术摘吴文俊奖,将推千亿级’言犀产业大模型’,你准备好了吗?
研博论文

京东凭AI技术摘吴文俊奖,将推千亿级’言犀产业大模型’,你准备好了吗?

京东云旗下的言犀团队凭借其在任务型智能对话交互关键技术及大规模产业应用上的创新成果,成功斩获第十二届吴文俊人工智能科学技术奖科技进步奖和个人杰出贡献奖,显示出企业在人工智能领域的强大积累和显著成就。京东计划于2023年推出新一代千亿大模型——言犀产业大模型,该模型将首先在京东内部测试,未来有望推动零售、金融等相关产业的快速发展。此次获奖以及对AI大模型的研发,凸显了京东积极布局并满足当前人工智能发展趋势的战略眼光。
「ChatGPT元年:探索新世界,企业如何应对?」
研博论文

「ChatGPT元年:探索新世界,企业如何应对?」

首届中国AIGC产业峰会在京举办,聚焦大模型、生成式AI及ChatGPT等热门话题,发布了首份全景报告和50强榜单,标志着2023年被称作ChatGPT元年。会议上,世界级AI科学家周明分享了ChatGPT对NLP技术的影响,强调中小模型在研发中的重要性。百度集团袁佛玉展示了文心一言的商业化潜力,而微软的战略规划和科大讯飞的技术落地实践也受到关注。整个峰会探讨了AIGC带来的机遇与挑战,以及多模态生成可能带来的内容革命和商业模式变革。
如何在ChatGPT时代分辨各路大语言模型?揭秘基础LLM与新兴霸主的秘密对比
本科论文

如何在ChatGPT时代分辨各路大语言模型?揭秘基础LLM与新兴霸主的秘密对比

文章总结:ChatGPT的出现激发了大语言模型的多样性和快速发展,不同版本和模型如GPT-3.0、GPT-3.5等众多,结构上以GPT-style为主。基础语言模型,尤其是GPT-style,展示了强大的通用性,只需任务提示前缀就能适应多种NLP任务。OpenAI的GPT系列模型,特别是GPT-3,因其出色的性能和零样本学习能力,在大语言模型中占引领地位。LaMDA通过预训练和微调生成安全响应,Jurassic-1模型在数据补全和少样本学习上超越了GPT-3,而Megatron-Turing NLG则实现了优秀的性能。然而,训练大语言模型面临挑战,如参数过大可能导致某些任务性能提升有限,资源浪费。针对这些问题,Chinchilla被提出作为计算优化的解决方案,通过调整模型规模与训练tokens比例来平衡成本和效率。
ChatGPT不‘智障’了?但它还是外星人的‘念经’僧,中文考试露怯,文心一言或许才是真智能的先驱
研博论文

ChatGPT不‘智障’了?但它还是外星人的‘念经’僧,中文考试露怯,文心一言或许才是真智能的先驱

文章介绍了ChatGPT作为一款先进的人工智能工具,在英语领域表现出色,能协助学生作业和创作,甚至在求职中发挥作用。然而,它在中文环境下存在局限,对于法律和公务员考试的解答错误,显示出对中文理解的不足。相比之下,百度计划推出的“文心一言”由于更深入的数据训练,预计将在处理中文问题上更具优势。作为中国本土的人工智能,百度有望在这个领域取得领先地位,并通过即将上市的“文心一言”提供深度体验。人工智能的发展正带来新热潮,而在中国市场,百度似乎已抢占了先机。