文献综述|人工智能在肝癌领域应用研究进展
润色

文献综述|人工智能在肝癌领域应用研究进展

点击上方“中国实用外科杂志” 可以订阅哦! 通信作者:程树群教授 江   宇 【引用本文】江    宇,柳宗翰,程树群. 人工智能在肝癌领域应用研究进展[J]. 中国实用外科杂志,2022,42(12):1428-1431. 人工智能在肝癌领域应用研究进展 江    宇1,2,柳宗翰2,程树群1,2 中国实用外科杂志,2022,42(12):1428-1431  摘要  近年来人工智能(AI)技术发展迅速,其子领域深度学习已广泛应用于医学图像处理和临床肿瘤学分析。很多研究结果已经表明将人工智能与医学相结合能够为医生带来较好的辅助作用,可以很好地帮助医生更快更准确地诊断疾病。医学影像方面,AI能够分类出CT、MRI影像片中不同器官,并通过影像片判断肝脏肿瘤的良恶性、预测肝癌微血管侵犯(MVI);数字病理方面,AI可以判断肝细胞癌的分化等级、诊断并分类MVI以及预测病人的术后生存率等。肝癌治疗方面,AI可以协助医生制定手术策略、为医生提供最适合病人的治疗方案,帮助医生做出治疗决策。 基金项目:国家自然基金重点项目(No.SHDC2020CR1004A,No.81730097,No.82072618,No.2022YFC2503700) 作者单位:1上海理工大学健康科学与工程学院,上海200093;2海军军医大学附属东方肝胆外科医院肝外六科,上海200433 通信作者:程树群,E-mail:chengshuqun@aliyun.com 原发性肝癌(hepatocellular carcinoma,HCC)是一种常见的恶性肿瘤,其发病率在全球恶性肿瘤中居第六位,病死率居第三位[1]。由于肝癌的发病极为隐匿,发现时已基本为中晚期,致使临床医生在进行快速准确的诊断时存在极大的困难。         人工智能(artifical intelligence,AI)是目前应用较为广泛的计算机技术。在医学上,AI最为主要的使用是在医学影像与肿瘤领域中[2]。利用AI进行医学图像的处理可迅速筛选出不同病变部位的影像图片,辅助医生对疾病进行快速和准确的诊断,帮助影像学专家分析肉眼难以辨别的影像细节和特征纹理[3]。        医学中,AI的应用主要包括影像组学[4]和深度学习[5]两大类。影像组学是医学数据与AI结合所产生的一种机器学习技术,通过数据表征算法从医学放射图像中提取并处理大量特征后进行分析建模,以辅助疾病诊断和预测治疗反应[6]。随着深度学习技术的迅速发展,影像组学近年来的优势不再明显,深度学习中卷积神经网络(convolutional neural network,CNN)技术和医学图像有着更高的契合度,可以更高效的从医学图像中提取特征。因此,很多领域深度学习模型的精确度都会高于影像组学。目前,在处理医学X线片、电子计算机断层扫描、磁共振成像、超声、数字病理等医学图像中,CNN模型判别良恶性疾病的能力甚至超过了资深的影像学专家和病理专家[7]。不仅如此,深度学习模型在疾病病理的分析方面也有着不错的表现,能够对HCC进行分期分级,对肝癌微血管侵犯(microvascular invasion,MVI)进行术前术后的预测判断。针对肝癌的治疗和预后,利用深度学习技术也可以为病人提供合适的治疗方案,预测术后生存率等。现就AI在肝癌领域的诊断和治疗应用前景及进展予以综述。1    AI辅助影像学诊断现阶段,基于AI的技术原理,在医学中较好应用的领域是影像学和病理学,其中医学影像的二维属性与数字化趋势是AI应用的最佳领域。肝癌的发病极为隐匿,而放射科医生通常需要花费大量的时间从CT或MRI扫描后获得的数千张影像中选出最相关的层面才能较为准确的进行诊断[8],且在这过程中可能存在误诊情况,影响病人的长期生存预后。因此,肝癌的早期检测和诊断尤为重要,可以帮助医生选择靶区和需要向病人提供的辐射剂量。         AI通过类似统计学的方式将每例病人的影像数据与诊断结果进行联系,识别出阳性病人影像数据中不同于阴性病人的特征,这些特征通常很难被医生肉眼所捕捉,并进行多轮次的训练来完善模型参数。因此,完成训练后的AI模型具有一定的判别良恶性疾病的能力。在各类肿瘤疾病的诊断竞赛中,AI的表现堪称完美。目前已被广泛应用于乳腺、胃和肠道[9]等癌症的诊断,同时对于癌症病人的预后预测也有比较高的价值[10]。         CT图像自动分类过程中特征选择是其关键步骤。由于高分辨率和快速CT扫描仪的广泛应用,大量的图像数据可以直接用于深层神经网络,而无需从CT图像中明确提取特征。CNN可以通过多个卷积层及不同的卷积核从图像中准确提取复杂的特征并对图像进行分类。根据分类后的肝癌CT图像进行诊断有助于肿瘤学家选择合适的治疗类型。肝癌从肝脏扩散到肺部,然后扩散到骨骼,但扩散到其他捕获器官的可能性很小,结合这一点,有报道利用CNN将CT扫面出的大量影像片分成不同器官类别,并选择出最相关的肝脏影像片数据,帮助医生实现对肝癌病人的快速诊断和完成治疗决策[7]。  ...
人工智能:挑战与机遇
润色

人工智能:挑战与机遇

这篇文章主要探讨了人工智能对人类生活的影响以及它对人类工作岗位的威胁。文章指出,当前的主要研究可以分为三类:综合研究类、各国政府的规划和报告、专项研究论文。综合研究类探讨人工智能的技术、应用的发展,并在此基础上探讨社会问题以及可能的解决方案。各国政府的规划和报告则主要关注人工智能对技术和产业发展的推动作用,而不是理论研究。专项研究论文则主要针对人工智能所产生社会影响的某个领域或某个技术专项的影响进行研究。文章还介绍了人工智能概念的演变和发展阶段,并对其应用进展进行了概括。
194篇文献调研ChatGPT最新研究进展!最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著
润色

194篇文献调研ChatGPT最新研究进展!最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

本文对GPT系列中最先进的大型语言模型(LLM) ChatGPT和GPT-4及其在不同领域的应用前景进行了全面的综述。事实上,关键创新,如在整个万维网上捕捉知识的大规模预训练、指令微调和从人工反馈中强化学习(RLHF),在提高llm的适应性和性能方面发挥了重要作用。对arXiv上的194篇相关论文进行了深入分析,包括趋势分析、词云表示和跨不同应用领域的分布分析。研究结果表明,人们对ChatGPT/GPT-4的研究兴趣显著增加,主要集中在直接的自然语言处理应用上,同时在教育、历史、数学、医学和物理等领域也显示出巨大的潜力。本研究旨在揭示ChatGPT的能力、潜在意义、伦理问题,并为该领域的未来发展指明方向。1. 引言自然语言处理(NLP)的最新进展导致了强大的语言模型的发展,如GPT(生成式预训练Transformer)系列[1,2,3,4,5],包括ChatGPT和GPT-4等大型语言模型(LLM)。这些模型是在大量文本数据上进行预训练的,并在广泛的NLP任务中表现出卓越的性能,包括语言翻译、文本摘要和问答。特别是ChatGPT模型在教育、医疗、推理、文本生成、人机交互和科学研究等各个领域都展示了其潜力。 LLM开发的一个关键里程碑是InstructGPT[5],一个框架,允许基于人工反馈强化学习(RLHF)对预训练语言模型进行指令微调[6,5]。该框架使LLM能够适应广泛的NLP任务,通过利用人工反馈使其高度通用和灵活。RLHF使模型能够与人类的偏好和价值观保持一致,这与仅通过无监督预训练训练文本语料库的大型语言模型相比有了显著提高。ChatGPT是InstructGPT的继承者。自2022年12月发布以来,ChatGPT已经具备了这些先进的开发,在推理和广义文本生成等各种下游NLP任务中取得了令人印象深刻的性能。这些前所未有的NLP能力促进了教育、医疗、人机交互、医学和科学研究等不同领域的应用。ChatGPT得到了广泛的关注和兴趣,越来越多的应用和研究利用了其巨大的潜力。多模态GPT-4模型的公开发布进一步扩展了大型语言模型的视野,并促进了涉及文本以外的各种数据的令人兴奋的发展。 本文对ChatGPT的现有研究及其在各个领域的潜在应用进行了全面的综述。为了实现这一目标,我们对arXiv库中与ChatGPT相关的论文进行了全面的分析。截至2023年4月1日,在arXiv上共有194篇论文提到了ChatGPT。在这项研究中,我们对这些论文进行了趋势分析,并生成了一个词云来可视化常用术语。此外,我们还检查了不同领域的论文分布,并给出了相应的统计数据。图1显示了ChatGPT相关论文的每日提交趋势,表明人们对该领域的兴趣越来越大。图2展示了所有论文的词云分析。我们可以观察到,目前的研究主要集中在自然语言处理上,但在教育和历史等其他领域的研究仍然有很大的潜力。图3进一步支持了这一点,它显示了在各个领域提交的论文的分布,强调了在这些领域进行更多研究和开发的必要性。本文旨在揭示ChatGPT的潜力,并深入探讨其对未来的潜在影响,包括伦理方面的考虑。希望通过本文的综述,为未来如何改进和扩展这些模型提供见解。在第2节中,我们将回顾与ChatGPT相关的现有工作,包括它的应用、伦理考虑和评估。除了讨论ChatGPT相关的研究现状,我们还将在第3节中探讨其局限性。此外,还将为语言模型的未来发展方向提供指导。 2  ChatGPT的相关工作 在本节中,我们对ChatGPT的应用、伦理、评价等方面的最新研究进展进行了综述。2.1 ChatGPT的应用2.1.1 问答在教育领域,ChatGPT通常用于教育领域的问答测试。用户可以使用ChatGPT学习、比较和验证不同学科(如物理、数学和化学)的答案,或者概念学科(如哲学和宗教)的答案。此外,用户可以提出开放式和分析性的问题,以了解ChatGPT的功能。在数学领域,Frieder等人构建了由研究生水平数学试题组成的GHOSTS自然语言数据集。作者使用问答格式在GHOSTS数据集上测试了ChatGPT的数学能力,并根据细粒度标准对其进行了评估。在涵盖简单集合理论和逻辑问题的Grad文本数据集上,ChatGPT表现最好。然而,在奥林匹克解题数据集上,ChatGPT表现不佳,只得到了两个4分的分数(总分5分),大部分分数都是2分。在Holes- In – proof数据集中,ChatGPT得到了最低的1分。在数学数据集中,ChatGPT只在26%的案例中获得了令人印象深刻的分数。这些结果表明,ChatGPT的数学能力明显低于普通的数学研究生。虽然ChatGPT可以大致理解数学问题,但却无法提供正确的解决方案。Pardos等人[8]使用开放自适应辅导系统(OATutor)来调查ChatGPT生成的提示是否对学习代数有帮助,来自Mechanical Turk的77名参与者参加了实验。实验使用的问题来自OpenStax的初等和中级代数教科书。这些参与者被随机分配到控制组(有手动提示)或实验组(有ChatGPT提示)。对于两门课程中的每一个问题,作者都通过问答形式从ChatGPT中获取答案,并根据三个标准进行评分:ChatGPT提供了一个答案,答案正确,答案中没有使用不当的语言。研究发现,ChatGPT生成的提示有70%通过了人工质量检查,无论是人类还是Chat- GPT都产生了积极的学习收益。然而,人工提示的得分在74.59% – 84.32%之间,明显高于ChatGPT提示的得分。Shakarian et al.[9]研究了ChatGPT在数学应用题(MWPs)上的表现,使用DRAW-1K数据集进行实验。该数据集由1000个MWPs和他们的答案组成,以及用于解决此类问题的代数方程模板。作者利用机器学习自省的思想,使用随机森林和XGBoost构建性能预测模型,并在数据集上使用五折交叉验证对其进行评估。ChatGPT的准确率从最初的34%提高到最终的69%,而召回率从最初的41%提高到最终的83%。作者还发现,ChatGPT的失败率从最初的84%下降到最终的20%,这表明,具体的工作要求可能会有很大的差异。 在物理学领域,Lehnert等人[10]通过研究ChatGPT如何处理弦论中的沼泽地猜想等晦涩的物理话题,探索了ChatGPT的能力和局限性。实验对话从弦理论领域更广泛、更一般的问题开始,然后缩小到具体的沼泽地猜想,并检查ChatGPT对这些猜想的理解。研究发现,ChatGPT可以不同地定义和解释各种风格的概念,但并不能有效地将各种概念真正联系起来。它会在必要时自信地提供虚假的信息和捏造的陈述,表明ChatGPT不能真正创造新的知识或建立新的连接。然而,在识别类比和描述视觉表征的抽象概念方面,ChatGPT可以巧妙地使用语言。Kortemeyer et al.[11]通过问答测试评估了ChatGPT回答基于微积分的物理问题的能力。测试包括在线作业、点击器问题、编程练习,以及涵盖经典力学、热力学、电学和磁学以及现代物理的考试。虽然ChatGPT能够通过这门课程,但它也展示了许多初学者普遍存在的误解和错误。West et al.[12]在大学物理第一学期使用力概念量表(Force Concept Inventory, FCI)来评估ChatGPT在回答与运动学和牛顿力学相关的物理概念问题时的准确性。FCI涵盖了运动学、抛射运动、自由落体、圆周运动和牛顿定律等主题。该研究包括了415名在学期末参加FCI的学生的数据,平均分数为56%,而ChatGPT的分数大约在50%到65%之间。作者论证了ChatGPT在物理学习上的表现可以达到甚至超过一个学期大学物理的平均水平。 在医学领域ChatGPT的问答功能也可以应用于医疗领域,如回答患者提出的医疗问题或协助医疗专业人员诊断疾病。11月等人[13]评估了使用ChatGPT进行医患沟通的可行性。实验从EHR中提取了10个具有代表性的医患互动,将患者的问题放置在ChatGPT中,并要求ChatGPT使用与医生的回答大致相同的字数进行回应。每个患者的问题由医生或ChatGPT回答,并告知患者5个问题由医生回答,5个问题由ChatGPT生成,并要求患者正确识别回答的来源。实验结果显示,正确识别ChatGPT回应的概率为65.5%,而正确识别医生回应的概率为65.1%。此外,实验发现,患者对ChatGPT功能可信性的反应为弱阳性(李克特平均得分:3.4),信任随着问题中健康相关任务复杂性的增加而降低。ChatGPT对患者问题的回答与医生的回答仅略有不同,但人们似乎信任ChatGPT回答低风险的健康问题,而对于复杂的医疗问题,人们仍然倾向于信任医生的回答和建议。Tu等[14]探索了ChatGPT在神经性疼痛诊断中的因果发现能力。因果关系发现旨在纯粹基于观察到的数据[15]揭示潜在的未知因果关系。实验结果发现,ChatGPT在理解新方面存在一定的局限性超越现有文本训练数据语料库的知识和概念,即它只理解描述情况常用的语言,而不理解底层知识。此外,它的性能一致性和稳定性不高,因为实验观察到,在多次询问下,它会对同一问题提供不同的答案。然而,尽管ChatGPT有很多局限性,我们相信它在改善因果关系研究方面有很大的机会。 Guo et al.[16]尝试将ChatGPT应用于通信领域,具体来说是将ChatGPT用于有序重要性语义通信,其中ChatGPT扮演了智能咨询助手的角色,可以代替人类识别消息中单词的语义重要性,可以直接嵌入到当前的通信系统中。对于一条要传输的消息,发送者首先利用ChatGPT输出每个单词的语义重要性排序。然后,发送者基于重要度顺序执行不等错误保护传输策略,使消息中重要单词的传输更加可靠。实验结果表明,在嵌入ChatGPT的通信系统中测量到的重要单词的错误率和语义损失远低于现有的通信方案,说明ChatGPT可以很好地保护重要单词,使语义通信更加可靠。 Wang et al.[17]研究了ChatGPT在为系统文献搜索生成高质量布尔查询方面的有效性。他们设计了广泛的提示,并在100多个系统综述主题上调查了这些任务。最终,与目前最先进的查询生成方法相比,ChatGPT生成的查询取得了更高的准确率,但代价是召回率降低。对于有时间限制的快速评论,以较高的准确率换取较低的召回率通常是可以接受的。此外,ChatGPT可以通过引导提示生成高搜索精度的布尔查询。然而,需要注意的是,当两个查询使用相同的提示符时,ChatGPT会生成不同的查询,这表明了它在一致性和稳定性上的局限性。总的来说,这项研究证明了ChatGPT在为系统文献搜索生成有效的布尔查询方面的潜力。 2.1.2 文本分类 文本分类的目的是将文本数据分配给预定义的类别。这项任务对许多应用至关重要,包括情感分析、垃圾邮件检测和主题建模。虽然传统的机器学习算法已被广泛用于文本分类,但自然语言处理的最新进展导致了更先进技术的发展。ChatGPT在这一领域显示了巨大的潜力。文献中的多项研究表明,它能够准确地对文本进行分类,处理各种分类任务的灵活性,以及可定制的潜力,使其成为文本分类的一个有价值的工具。 Kuzman et al.[18]采用ChatGPT进行自动体裁识别,目标是利用ChatGPT的零样本分类能力来简化文本分类任务。他们使用两种提示语言(EN和SL),与基于多语言模型xln – roberta的X-GENRE分类器在英语数据集EN-GINCO和斯洛文尼亚数据集GINCO上进行了比较。 结果显示,当使用EN作为提示语言时,ChatGPT实现了Micro F1、Macro F1,准确率得分分别为0.74、0.66、0.72。 但在GINCO数据集上,ChatGPT对EN和SL两种提示语言的流派识别性能都不同程度地低于x流派分类器。...
中国学者“尝鲜”AI生成基因编辑技术文献图书新民晚报2022-07-08 08:23新民晚报2022-07-08 08:23
综述

中国学者“尝鲜”AI生成基因编辑技术文献图书新民晚报2022-07-08 08:23新民晚报2022-07-08 08:23

新民晚报讯(记者 马亚宁)继应用人工智能(AI)技术出版了两本图书之后,近日,施普林格·自然(Springer Nature)又出版了第三本由AI生成的图书。这是一本有关CRISPR基因编辑技术的文献综述类图书。新书主编均来自上海科技大学,分别是生命科学与技术学院博士生张子恒、图书信息中心学科馆员王萍和生命科学与技术学院刘冀珑教授。这是施普林格·自然首次使用AI摘要生命科学领域的文献生成图书,也是首次有中国学者参与其AI生成图书的实验。 CRISPR及其相关技术是近年来一个重要的研究热点,相关研究成果呈爆炸式增长,截至2022年6月,仅施普林格·自然就已出版了超过5.3万篇相关论文(据Dimensions数据库)。因此,研究人员面临着如何从大量文献中快速了解和掌握该领域最新科学进展的挑战。施普林格·自然将AI应用于学术出版的一系列实践为应对这类挑战提供了解决方案。 施普林格·自然曾于2019年出版了一本完全由AI生成的有关锂离子电池的图书,紧接着又在2021年采用混合人机交互方式出版了另一本AI生成的文献综述图书《气候、行星和进化科学:计算机生成的文献综述》,将人工撰写的文本和计算机生成的文献综述融合在一起。 此次,《CRISPR》一书则是基于施普林格·自然最新的AI平台Auto Summarization(自动摘要)。首先,主编团队根据自定的关键词检索施普林格·自然近年来出版的该领域的期刊论文,再根据研究领域知识图谱计算及主编的理论框架在检索结果中筛选出114篇论文。 AI平台在读取这些论文的全文之后,自动生成摘要。最后,主编团队将这些文章摘要分类和排序后划分为6章,并人工撰写各章节的简介,以方便读者阅读。 该书全面展现了CRISPR相关领域的最新研究进展,为有志于CRISPR及其相关技术研究的研究生,以及处于起步阶段的研究人员带来了非常有用的参考资料。该书主编之一的刘冀珑教授说:“CRISPR与锂电池研究领域一样,近年来都涌现了大量论文,因此非常适合使用AI更加快速和有效率地生成文献综述。我非常高兴能参与施普林格·自然的这个实验性项目,并见证AI如何在图书创作和知识传播中发挥其重大潜力。相信在不久的将来,这一基于AI的文献自动摘要系统将会进一步促进科学进步,为人类的知识传播作出革命性的贡献。” 施普林格·自然集团大中华区总裁暨全球图书业务总裁汤恩平博士说:“这本新书融合了人工和计算机撰写的内容,是人机交互生成图书的又一个极好的例子。目前,我们正使用这一AI平台帮助更多的作者生成图书内容,相信今后读者会看到更多的这类图书。此外,我们也在探索由AI生成图书的部分章节,其它各章节仍由人工撰写的实践。” 该书电子版上线4个多月以来,已有2700多次访问(包括电子书在线阅读和下载),平均每章被访问400多次。 举报/反馈