文章主题:机器之心报道,编辑:杜伟、陈萍,快速阅读论文,Kirill Demochkin
机器之心报道
编辑:杜伟、陈萍
在科研领域,高效阅读论文是一项至关重要的技能。有些研究员需要花费相当长的时间去理解一篇论文,而有些人则能迅速掌握其中的核心要义。在这篇文章中,Kirill Demochkin仅仅用了2.5个小时,就完成了论文的阅读、撰写摘要以及发布博客的过程。那么,他是如何做到的呢?值得我们深入探讨。
一万个人心里有一万个哈姆雷特,对于论文写作与阅读,每个人都有自己的观点与方法。
在科研领域中,撰写论文以及阅读他人的论文是一项至关重要的技能。一篇优秀的论文需要综合考虑多个方面的因素,其中最重要的是能够清晰地传达研究的核心观点,并提供充分的证据来支持这一观点的可行性。为了实现这一目标,作者需要在论文的各个层次,包括句子、段落、章节以及整篇文章的结构上进行精心的构建和安排。
在AI领域的研究中,撰写优秀的论文是一项至关重要的任务。要想在这个领域取得突破,必须养成良好的写作习惯,努力追求具有深度的见解和广泛影响力的论文。为了达到这一目标,我们需要将论文精炼至极致,同时保持简洁明了的阐述,确保论文的内容定位准确无误。这些经验已经成为AI论文写作的黄金法则,遵循它们将有助于我们更好地开展研究并取得更好的成果。
Kirill Demochkin,一位来自三星人工智能中心的研究科学家以及Casual GAN Papers网站的创始人,始终关注并积极参与论文写作领域的经验分享。近期,他用自己过去的6个月时间,为50篇AI相关论文撰写了摘要,并通过这个过程总结出了许多宝贵的经验和教训。
Kirill Demochkin
在这50篇论文中,大致有40%的内容围绕GAN或其相关技术展开,而剩余部分则涵盖了NeRF、Visual Transformers、CLIP等其他具有吸引力的主题。
Kirill Demochkin分享了他每周撰写两篇摘要的经验,并表示在这个过程中他学到了一些宝贵的技巧,现在他想与大家分享这些经验!
作为一名专业的文章写作高手,我会按照您的要求对原文进行改写,确保满足您的字数要求,同时保持文章的专业性。以下是改写后的内容:在进行文章创作时,他会系统地阅读整篇论文,撰写简洁明了的摘要,并将关键图表转化为图片形式。这一过程通常耗时约2.5小时。他往往会挑选那些在视觉上具有吸引力或在推特上引发热烈讨论的论文。此外,他还偏爱那些富有创意和趣味性的论文,这些论文包含引人入胜的图像、动态展示效果以及吸引人的标题。在他决定为某篇论文撰写摘要之前,他会仔细检查是否需要阅读相关领域的必备资料。接着,他会深入了解新方法试图解决的问题,并探讨现有方法存在的不足之处,从而确保所撰写的摘要具备深度与广度。
然后,他会浏览「方法」部分,查看论文图表。
最后,确保「实验」部分在数字、指标、基线和消融方面有意义。
花6个月时间撰写50篇AI论文摘要有其必要性和重要性。在快节奏的AI研究领域,研究人员必须具备快速阅读论文的能力。同时,对自己所阅读论文的主题进行概括和总结,有助于加深对相关知识的记忆和理解。
在一篇关于时间管理的问题中,Demochkin指出,从开始阅读论文到最终发布博客所需的时间大约为2.5个小时。这一观点引发了网友们的热议,其中有人提出了一个疑问:“2.5个小时是指整个过程,还是有仅限于阅读论文的时间呢?”此外,还有一位求职者在一次面试中被要求在短短的1.5小时内阅读并理解一篇AI论文(该论文约为6-10页)。令人惊讶的是,他在还没读完论文的情况下就被要求进行复现,这无疑使得这次面试之旅变得尴尬不堪。由此,他开始反思,是否只有自己需要在提升自身的技能水平,还是这样的时间限制对于完成整个过程来说是正常的呢?
还有网友表示:「这取决于我想深入研究的深度和我对该领域的熟悉程度,但我可能需要几个小时才能彻底阅读一篇不熟悉的论文并写出笔记。实现所需的时间差别很大,但在 1.5 小时内完成所有这些听起来有点疯狂,除非它真的很简单。」
还有人觉得这听起来很疯狂。
Kirill Demochkin 阅读论文技巧
Kirill Demochkin 查看论文的资源来自 paperswithcode、reddit,以及同事分享的 feedly 列表。
了解背景知识
论文不是凭空写的,几乎任何一篇论文都有前期研究,甚至是像 NeRF 这样的突破性研究。理解前期工作能够帮助我们了解所提方法潜在的优缺点。不幸的是,我们不能花费一周的时间来研究论文中所引用的论文,以构建这一背景知识。因此最好的策略是通过明确写出一篇论文试图解决的具体任务、现有的替代解决方案、这些解决方案会带来的问题,以及为什么作者认为他们的方法避开了这些问题。
把握文章主旨
阅读文章时首先要阅读章节和小节标题,并将它们与文章中提出的架构 / pipeline 的图形部分联系起来。这样,在阅读文章细节之前,你会在脑海中勾勒出论文大概框架。
对实验进行全面检查
文章作者通常会将所做的研究进行打包,以软件包的形式呈现出来。但是这样做,有时会遗漏一些重要细节。通常来说,对研究打包是很好的,但是,从另一方面你可以根据遗漏的内容和原因获得更多的见解。要实现这一点,你需要做到以下几条:
检查基准:最近有没有什么方法被忽略了?
控制变量检查:是否对 pipeline 中的每一部分都进行了测试?
检查数据:是否有已知的数据集没有在实验结果中提到?也许,被遗漏的数据集有一个共同的特点,即指出了所提方法的一些弱点。
关于实验的一些见解
试着马上确定阅读什么论文可以更好的帮助理解新方法。你可能完全被这篇文章中发生的事情弄糊涂了,却意识到遗漏的细节在另一篇文章中有详细介绍。
尽量搞清楚,新论文试图解决的核心问题是什么。拥有背景知识对了解重点是很有必要的。
将文章与论文中的图连接起来,仅基于文本想象复杂的架构是非常困难的。
不要只停留在文章表面,你需要检查实验部分,看看你是否发现了任何不一致或明显的遗漏的地方,这可能暗示了遗漏的数据不符合论文的要求。
认真阅读总结部分,以快速获取项目其他想法。
最后,享受成功的喜悦,让好的结果帮助你实现更加优化的方法,以用到其他项目。
读写论文,大佬建议这样做
之前,机器学习曾介绍过清华大学副教授刘知远、AI 领域著名学者吴恩达等关于读写论文的经验分享。
写论文
刘知远为 NLP 领域的学生如何写出一篇合格的论文提供了一些建议,简单总结如下:
论文整体思路:问题务求挑战,模型务求创新,实现务求准确,实验务求深入。
一篇 NLP 论文的典型结构:摘要、介绍、相关工作、方法、实验和结论。每个部分都要各司其职,向学术界同行清晰准确地描述成果的创新点、技术思路、算法细节和验证结果。
介绍是对整个工作的全面介绍,是决定一篇论文能否被录用的关键。一般情况下:起手介绍研究任务和意义;随后简介面向这个任务的已有方法;接着说明已有方法面临的关键挑战;针对这些挑战,本文提出什么创新思路和具体方法;最后介绍实验结果证明本文提出方法的有效性。
摘要可以看做对介绍的简介,最简单的做法是,从介绍各部分精简 1-2 句话组成摘要。
相关工作部分主要是介绍本文任务和方法的相关工作,目标是通过对已有工作的梳理,凸显本文工作的创新价值。对已有工作的梳理,不应是对每个工作的简单介绍,而应当注意汇总、分类、分析,或者按照时间发展顺序,或者按照技术路线划分。
方法部分要详细介绍本文创新方法的具体细节,由于涉及非常艰涩的细节,采用「总 – 分」结构来介绍。
实验部分要详细介绍与实验相关的具体细节。一般先介绍实验数据、评测标准和比较方法等基本信息。
论文最后会有总结展望,一般用一段来再次总结和强调本文的创新思路和实验结果,然后说明未来建议的研究方向和开放问题。这部分相对来讲比较固定。稍微留意的是,在准备论文最后阶段,如果发现论文有哪些应当做还没来得及做的,可以写作本文的未来工作。
总之,刘知远认为,要想写出一篇合格的 NLP 论文,首先是态度问题,只有态度重视,才有可能不厌其烦地反复修改,才会「不择手段」地寻找各种办法来尽力改进论文(找学长找外教借助 Grammarly 工具等)。其次是动手问题,只有写下来,才可能不断改,只要改就能不断进步。最后是经验问题,要写得精彩可能需要天赋,而要写得合格,只要坚持写,不断根据评阅人和其他人的意见进行思考和修改,就可以进步。总之,坚持就是胜利。
读论文
在 CS230 课程中,吴恩达对于研究规划与如何读论文也提出了他的一些建议。
如果要高效地阅读论文,吴恩达表示我们想要知道论文的来源,例如 arXiv 或个人博客等。下面,如果我们列出 5 篇待读论文,那么吴恩达的习惯是每一篇列一行,表示从 0 到 100 的阅读进度。最开始我们只需要阅读每一篇的 10% 左右,如果发现论文 2 不是我们想要的,就终结它。如果论文 3 是重要的,那么仔细阅读到进度 100%。
由论文 3,我们可以发现其它相关研究,因此也可以加到论文列表中,例如第 6、7 篇。读完论文 3 也许会发现论文 4 也非常有意思,那么结合 4、6、7 继续阅读,并记录阅读进度。
最后,如果阅读 5-20 篇论文,差不多我们对该领域就有一定的了解了。如果高效阅读 50 到 100 篇论文,那么对该领域的理解就比较完整了。Ng 的背包内每天都会带一个文本夹,里面的纸质打印论文就是他的论文列表。
那么具体如何阅读一篇论文呢?吴恩达表示,从第一个词浏览到最后一个词,这是最差的方式。一般而言,我们要多次浏览论文,且每一次的目的都不相同。
首先第一遍应该只看标题、摘要和图表,摘要能告诉我们论文讲了什么,而对于深度学习研究工作,很多都能总结成一两张图表。第二遍应该继续看前言、结语和图表,其它的内容我们可以暂时不管。注意在看前言时,相关研究部分也可以不管,虽然该部分对于理解研究脉络很有帮助,但第二遍应该需要抓住主要思想。
第三遍阅读就要纵览论文主体了,但同时那些耗费时间的数学与推导部分可以暂时跳过,我们掌握整体脉络与框架就行。第四遍需要阅读所有的内容,但这时候肯定还会有一些部分不能理解,那么暂时跳过它们以后再攻坚。
参考链接:
[D] Here is what I learned from writing 50 summaries of popular AI papers!
by inMachineLearning
https://www.casualganpapers.com/how-to-learn-to-read-ai-papers-quickly/How-To-Read-AI-Papers-explained.html
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
《6个月为50篇AI论文写摘要,网友:这有啥,我曾被要求1.5小时内复现一篇论文》
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!