
各位看官阅读之前,请您点击一下“关注”,既方便您讨论与分享,又能给您带来不一样的参与感,感谢您的支持。
文丨行走的2B铅笔
编辑丨行走的2B铅笔
前言
人工智能在现代计算中获得了众所周知的相关性,因为它有效地解决了传统上由人类完成的复杂任务。人工智能提供了表示和推断知识和有效操作文本以及从大量数据中学习的方法。这些特征适用于人类认为费力或重复的许多活动例如科学文献的分析。

手动准备和撰写系统文献综述需要花费大量时间和精力,因为它需要规划策略和进行文献检索以及分析并报告结果。根据领域的不同检索到的论文数量可能达到数百或数千篇,这意味着过滤相关论文并提取关键信息成为一个成本高昂且容易出错的过程。
利用人工智能技术检索文献的原因
一些涉及的任务是重复性的因此需要通过人工智能实现自动化。在此对过去15年提出的人工智能技术进行了调查,以帮助人们对科学文献进行系统分析。描述了当前支持的任务和所应用的算法类型以及34项初步研究中提出的可用工具。

这项调查还提供了该领域发展的历史视角以及人类在日益自动化的单反过程中可以发挥的作用。所应用的算法类型以及34项初步研究中提出的可用工具。这项调查还提供了该领域发展的历史视角以及人类在日益自动化的单反过程中可以发挥的作用。
所应用的算法类型以及34项初步研究中提出的可用工具。这项调查还提供了该领域发展的历史视角以及人类在日益自动化的单反过程中可以发挥的作用。

人工智能已经帮助人们摆脱了在工作中重复执行的任务,但需要一些人类能力才能成功。科学家也不例外,他们也需要强大的计算技术来加速他们的结果。所以开始一项新的研究通常涉及对相关科学文献的深入分析,以了解背景并找到解决相同或相似问题的相关著作。
从大量论文中搜索和筛选提取关键信息是一项耗时的任务,如果没有经验或明确的指导方针,可能会导致丢失重要的贡献。通过提供严格的文献检索和分析方法可以减少潜在的偏差和错误。

系统文献综述是一项二次研究,它遵循完善的方法来查找相关论文和从中提取信息并正确呈现其主要发现。文献综述旨在提供研究主题的完整概述,通常提供历史视角,以便识别趋势和未解决的问题。
文献综述已成为许多科学学科的一项重要工作,例如医学发表评论数量最多的领域13,510 条和计算机6,342 条。众所周知进行文献综述的时间成本很高,特别是当涵盖广泛的领域时。为了支持SLR流程过去几年出于不同目的创建了多种工具。

除其他功能外SLR工具还可以从电子数据库导入文献搜索结果,根据纳入标准将其标记为相关或提供视觉辅助来分析作者和引文的元信息。自动化SLR过程作为计算研究中的一个应用领域正在引起人们的关注,提出半自动构建搜索字符串或从科学数据库中检索论文的方法。
自动化检索文献的好处
事实说明在选择相关论文或绘制调查结果报告时,使用自动化方法可以节省时间和资源。尽管如此一些人仍然认为由于所需的学习曲线以及缺乏评估其益处的研究,它们的实际使用受到限制。

这次重点关注使用人工智能作为主要驱动力的单反任务自动化,寻求通过额外的知识和建议来增强自动化方法和工具的功能。人工智能技术首次用于自动化SLR任务可以追溯到 2006 年,当时提出了一种神经网络,可以根据通过文本挖掘提取的信息自动选择主要研究。
遵循这个想法其他人探索了其他文本挖掘策略以及最近的机器学习和自然语言处理。考虑到 SLR方法所涉及的所有重复性任务,人工智能为科学文献分析带来的可能性是广泛的。人类在这个过程中发挥的作用不应该被削弱。

因为他们对这个过程有一个整体的看法,而当前的人工智能技术仍然缺乏。应用人工智能技术实现SLR流程自动化仍然是一个年轻的学科,预计在未来几年将继续发展。人们越来越感兴趣,这表明现在是分析目前提出的用于解决不同SLR任务的人工智能技术的好时机。
特别强调它们的目的和输入输出以及人为干预。迄今为止在该领域发表的一些二次研究已经将人工智能技术纳入了支持单反任务的方法和工具的分析中。这些要么是从更普遍的角度出发关注任何类型的自动化,要么专门研究特定的人工智能技术像机器学习或SLR任务。

这些可能缺乏对适用于整个单反流程的人工智能概念和技术的深入解释。在此对该领域进行了全面的调查,同时也试图深化人类在半自动单反过程中所扮演的角色,这是之前任何文献综述都没有考虑到的观点。
为了回应这些要求在调查中进行了系统的文献检索。从自动和手动检索检索到的9,000多篇参考文献中确定了34项初步探索。对这些工作进行分析是为了了解使用人工智能解决特定任务的目的。关注所提出方法的特征,包括它们的输入输出和算法选择。

再进行收集有关如何通过评估该方法的信息,包括性能指标和用于比较的论文语料库。经过分析发现有些任务比其他任务得到了更多的结果,并且早期提出的一些机器学习技术仍在使用。
人工智能与新机器方法的结合
最近还发现了一些最近的作品,探索人类可以更多地参与的新机器学习方法。通过对结果进行讨论来回答每个RQ,可以确定一些与不受支持的任务和尚未考虑的其他人工智能技术相关的开放问题和挑战。

系统文献综述是一项二次研究,它严格统一和分析科学文献以综合当前知识批判性地讨论现有提案并确定趋势。SLR遵循完善的方法来进行循证研究,包括问题的定义和查找相关论文的可复制程序从中提取信息。
搜索策略包括自动搜索和手动搜索,对于自动搜索查询以下来源Web of Science。定义用于检索论文的搜索字符串由多个术语组成,这些术语结合了与系统评论相关的关键字和涉及自动化的单词。

在选择与自动化相关的通用术语,而不是特定人工智能技术的列表,原因有两个该列表可能会使结果偏向于特定技术,从而防止不常见的方法出现在结果中。完整详细的技术列表将导致庞大且复杂的搜索字符串,而数据库难以管理这些搜索字符串。
更具体地说每篇论文的内容总结如下单反阶段和任务。该论文根据其自动化的SLR阶段进行分类,详细说明了该阶段的具体步骤。人工智能领域和技术这篇论文被分配到一个或多个人工智能领域,包括所使用的算法或方法的简短描述。

在规划阶段开始时,建议对SLR的范围和规模进行初步分析。在健康研究的背景下,范围界定评论是一种快速确定研究主题的方法,需要对论文进行编目以获得研究主题的地图。其描述性性质无监督学习是合适的,因为它不需要数据标签即本例中的预定义研究主题。
聚类在这里成为一种相关方法因为它能够识别实体组例如共享特征的论文。灵格3G是一种文档聚类算法,已用于根据标题和摘要对相似论文进行分组。它允许论文关联到多个集群,还可以生成分层集群,从而提供更精细的主题分类。

实施阶段的人工智能技术
审阅者可以将聚类映射到概念,该方法使用卫生机构之前的范围界定审查结果进行评估,将聚类自动生成的主题与手动审查分配的主题进行比较。虽然审查过程本身应该在整个 SLR 开发过程中进行分析,但有关可用资源和任务优先级的决定应该在规划阶段做出。
流程挖掘已被认定为一种了解SLR活动所需工作和通常组织的潜在方法。除其他方法外流程挖掘还包括许多通过日志事件分析业务流程的数据挖掘技术。其主要目标是识别趋势和模式,以生成知识并提高业务流程的效率。

分析由多学科团队模拟的12个手动SLR流程生成的事件日志。日志代表流程挖掘方法的输入,该方法能够提取有关任务分配和时间表以及以人小时衡量的工作量的信息。更具体地说启发式挖掘算法分析事件的频率以确定最相关的活动以及它们的临时分布方式。
需要构建依赖图来发现SLR任务之间的序列模式,一个任务通常是否后面跟着另一个任务。此外还执行模糊挖掘算法通过排除不太相关的活动或其特征有花费的时间和涉及的人员等来抽象不同的评论模型。

这一阶段从人工智能的角度引起了极大的关注,59%的初步探索与其任务相关。初级探索的选择是最常支持的任务,共有18篇论文。ML是现阶段使用最广泛的AI分支,通常与NLP和文本挖掘相结合。
首先描述如何从机器学习的角度解决论文选择问题。然后重点关注那些在实施阶段已通过其他不同人工智能技术实现自动化的任务。使用ML自动选择主要研究需要两个主要步骤,提取特征来表征论文和训练分类器以区分要纳入SLR的论文和要排除在SLR之外的论文。

用于论文选择的特征提取通常需要从标题和摘要创建主题或关键字列表。NLP和文本挖掘被应用于计算处理和处理此类文本信息。NLP提供了从文本片段中检索和提取信息的有效机制,以便机器可以处理它们。
NLP涉及一系列处理和合成数据的步骤,像单词标记和删除停用词以及词干提取。文本挖掘将NLP步骤与数据挖掘方法相结合以处理和分析大文本片段,文本挖掘对于推断非显性知识和处理语义方面特别相关。

结语
事实说明人工智能的应用可以有效地自动化许多人类认为成本高昂且重复性的任务例如进行文献综述。规划执行和报告SLR涉及许多单独的任务,因此观察到并非所有任务都已实现自动化也就不足为奇了。

人们对应用人工智能特别是机器学习来支持论文筛选有着明显的兴趣,这是一项旨在从数千篇候选论文中识别相关作品的负担任务。关于其他任务可以强调使用本体和NLP来处理语义信息,尽管如此这些领域的探究仍然远远不够丰富。
文章描述过程、图片都来源于网络,此文章旨在倡导社会正能量,无低俗等不良引导。如涉及版权或者人物侵权问题,请及时联系我们,我们将第一时间删除内容!如有事件存疑部分,联系后即刻删除或作出更改。
评论留言