长期以来,AI仿佛就是在科幻小说和电影里面出现,但今天AI不再仅仅是科幻产品。1942年,英国数学家艾伦图灵(Alan Turing)建造了一台名为‘the Bombe’的机器,帮助破解德国军队使用的神秘密码。8年后,他发表了他的开创性文章“机器能思考吗?”。在这项工作中,他着手建立认知原则、功能和功能的基础。图灵认为,建立能够“模仿”人类思想的机器是可能的。与其他革命一起,如蒸汽机、科学和批量生产以及数字技术,AI现在被认为是“第四次”工业革命。
AI几乎无处不在,尤其是大科技公司使用的工具,如苹果、亚马逊、Facebook、谷歌、微软等。AI也会在彻底改变生命科学,尤其是生物医学和医疗保健,旨在改善疾病诊断和患者结局,从而降低医疗成本。
01AI和生命科学
在过去的五十年里,世界见证了信息技术(IT)领域的一场真正革命,它导致了大量数据的产生和存储,不仅在技术领域,而且在其他领域,使研究人员能够提供各种产品和服务。如今,大数据在改善医疗结果和人群健康方面具有前所未有的潜力。鉴于不同来源数据的数量和复杂性不断增加,大数据与计算资源直接相关,其中计算资源包括结构化、半结构化甚至非结构化的信息。
然而,我们应该如何处理这种大量数据?由于这些本身并不提供非常多的信息,因此有必要使用分析方法,如AI算法,能够将数据转化为可操作的分析知识。尽管AI的含义众多,但它可以大致理解为过程和实践方面的研究,允许开发能够执行智能任务(如决策)的计算机系统,而不仅对这些任务进行编程。
在AI中最流行的方法是使用机器学习(ML),它涉及使用现代计算机和数学算法从可用的数据集中推理和推断,确定变量之间的交互模式,从而允许模型改进自己并从经验中学习。深度学习(DL)是ML的一个子领域,它使用多层人工神经网络(ANN)来识别原始数据中的模式,从复杂数据中获得学习模型。因此自从21世纪来,出版发行的文章量就不断增加(图1)。

图1. 2000年至2020年间涉及人工智能(AI)和生命科学的出版物数量
目前,研究人员的专业知识和机器潜力的结合旨在改善在部分医学专业使用成像的诊断,如放射学、皮肤科、病理学和眼科。根据Hamet和Tremblay的说法,AI在医学中的应用可以分为两个方面,一个是虚拟的,其中使用ML(更常见的是DL),一个是物理的,其中AI是由机器人进行的。然而,AI技术将可能在不久的将来影响急诊医学和医疗保健提供的其他方面。
最近在自然语言处理(NLP)方面的进展来自于模型框架和模型预训练的进步,其中Transformers可以进行更高容量模型的构建和该能力在各种任务中的有效使用。Transformers旨在反映标准NLP&ML模型流水线:处理数据、应用模型并做出预测。鉴于Transformers和预训练在NLP中的作用越来越重要,研究人员和终端用户可以访问这些模型也非常重要。
为全基因组序列标记任务引入Transformers,可以对长DNA序列的更好处理和注释,并且在序列标记方面胜过神经网络。中医研究人员也在将Transformers应用于他们的记录分类中。他们探索了各种各样的最先进的DL模型,发现与所有其他学习模型和最先进的方法相比,Transformers可以取得更好的结果。
Transformers应用于电子健康记录(EHR),以提高预测未来诊断的准确性,以评价疾病嵌入、注意力和可解释性,从而提高疾病预测。有人说,Transformers将是医学的未来,因为他们可以与工程生物学并肩工作,使得在有害微生物内部重编程DNA成为可能。这正使它们成为挽救患者的药物,并使构建活体诊断成为可能。
2019年,Park及其同事开发了一种神经网络分割模型(HeadXNet),能够通过计算机断层扫描血管造影(CTA)生成颅内动脉瘤的体素预测。应用该模型后,他们证实临床医生的灵敏度、精确度和可靠性显著增加,优化了患者护理。Sheth及其同事开发并验证了一种基于ML(DeepSymNet)的自动化方法,能够使用CTA评价患者的大血管闭塞(LVO)和缺血核的体积,结果令人满意。
另一种ML技术是随机生存(RF)森林,在预测6种心血管结局方面的数据表明,ML结合深度表型分析提高了在最初无症状人群中预测心血管事件的准确性,这可能导致在没有因果关系假设的情况下更好地理解亚临床疾病标志物。
AI的这些进展使放射成像中能够评估风险、检测、诊断、预后和对不同治疗的反应的任务完成成为可能,并允许通过多种“组学”工具发现疾病。如美国研究人员所示,这些技术可以应用于改善已经在使用的成像技术,他们评估了医学成像是否可以用于肌肉骨骼(MSK)问题患者,允许更多地使用常见的MSK成像模式。此外,这种方法也可用于肝脏影像学检查。
使用AI进行药物设计的最大挑战是如何避免昂贵的高通量筛选(HTS),以保证可以自动生产最佳可能组合特性的新结构。这个问题具有挑战性,通过设计真正有效的药物必须克服的五个瓶颈:获得大量的数据集;生成假定的结构;基于多个标准的优化选择;缩短设计-制造-测试分析(DMTA)周期;以及利益相关者(研究人员和商业人员)科学心态的改变。
最近,科学家们一直在利用DL设计更特异、不良反应更少的药物。DL是一组ML技术,使用几个多层神经网络(“深度神经网络”)来建立众多和复杂变量之间的关系。DL的主要目的与基于配体的化合物优化有关,以生成广泛的候选分子,并将选择限制在少数,旨在快速合成和检测。
关于蛋白质结构的设计,由谷歌开发的AlphaFold 2可以有效地利用未标记的数据,比其他算法更精确地预测蛋白质的3D结构。谷歌的AI机器在解决蛋白质3D形状方面取得了很大的飞跃,因为该算法将DL应用于结构和遗传数据,以更高的精确度和准确性预测蛋白质中成对氨基酸之间的距离,也许会导致蛋白质折叠领域出现意想不到的进展。
尽管取得了很多进展,但AI用于药物设计仍然存在三大技术障碍:基于从非常有限的数据集中获得的基本设计结构;需要使用结构和功能知识水平较低的生物分子作为假定药物靶标;以及获得大的标记数据集的困难。
上述所有示例均表明,AI通过ML和其他技术的应用可以改善诊断、医疗保健质量和基于能够增强分析分析的算法的新药开发,彻底改变整个医学和生命科学领域(图2)。

图2.人工智能(AI)工具在生命科学和医疗保健中的应用
02AI助力对抗COVID-19
SARS-CoV-2病例数的增加使医疗系统负担过重,直接影响全球经济,产生全球危机。鉴于目前情况的严重性,来自不同科学领域的多学科方法已被用来防治大流行。COVID-19对新发病例和死亡人数的预测对于公共政策的制定至关重要。AI可用于追踪和预测这种疾病将如何随着时间和空间的推移而传播。
Zhu及其同事开发了一种DL算法和一种风险分层评分系统来预测COVID-19死亡率。他们通过使用COVID-19严重程度评分、CURB-65评分和肺炎严重程度指数(PSI)比较了预测的性能。数据表明,该模型可用于在资源和时间限制很少的环境中做出临床决策。在另一篇文章中,使用ANN提供患者特异性、入院点死亡风险预测,以在第一机会告知临床管理决策。
实时定量PCR(RT-qPCR)是诊断COVID-19的金标准方法;然而,该检测可能需要长达2天才能完成,需要额外的检测来排除假阳性;因此,迫切需要替代更快、更准确的方法。研究人员开发了COVID-19神经网络(COVNet),这是一种利用胸部CT检测COVID-19的3D DL框架。另一项研究使用乳腺CT和AI探索肺部受累患者巨噬细胞活化综合征(MAS)和重度COVID-19之间的可能相似性。
这些数据表明,使用AI是对抗最近冠状病毒大流行和未来大流行的一个有前景的工具。它不仅可用于预测病例数,还可用于患者的诊断和可能的治疗。此外,AI在目前使用的COVID-19疫苗的开发中一直很重要。
03真实世界的数据及证据
真实世界数据(RWD)可以定义为在随机临床试验(RCT)之外获得的与患者健康/或医疗保健提供相关的数据。记录的EHR数据可分为结构化数据(例如,国际疾病分类代码、实验室结果和药物)和非结构化数据(例如,医生笔记)。在执行统计测试和执行ML任务之前,非结构化数据(大多数记录的数据)需要复杂的处理,而结构化数据不需要。
RWD分析可生成真实世界证据(RWE),即:关于医疗产品使用以及潜在受益或风险的临床证据。但是,为了获得可用于监管用途和其他决策应用的高质量RWE,必须采集大量RWD并转换为可分析格式,确保一定水平的数据准确性和可靠性,为此AI功能越来越多地应用于RWD的分析。
三种AI功能特别适用于生成医疗保健行业的RWE:NLP、ML和RPA。NLP是在非结构化数据(例如,医生笔记或语音识别)中对人类语言进行的计算机化解释和组织,以指示特定的状况或事件。它包括文本分类、语法识别、基于句子中位置的单词意义解释以及以可计算、可解释和准确的方式进行的语言翻译。
相比之下,ML包括各种预测统计和数学建模技术,通常分层到NLP上,以重新解释和校正重复使用后的初始假设。2018年的一项调查显示,60%的制药行业受访者在其RWE项目中使用ML,95%的受访者预期在未来几年将AI用于此目的。此外ML可用于RWD,以开发疾病(如房颤)风险预测模型,或监测患者的健康。
用于生成RWE的第三种AI功能是RPA,其由自动执行重复任务的软件组成,有助于在减少人为错误的同时加快进程。该软件通过执行具体定义的任务,在许多部门带来了巨大的发展,但在某种意义上受到限制,无法适应不断变化的条件或借鉴经验。此外,RPA可与ML相关,在RWD分析中变得更有用。在这种情况下,RPA可用于根据脚本/编程集从非结构化数据中提取字段值,而ML从这些数据中学习以生成RWE。
04AI与临床试验
临床试验对于新药的开发至关重要。然而临床试验需要约10-15年,平均花费15-20亿美元;再者,进入临床试验的化合物只有十分之一进入市场。造成临床试验失败的两个主要因素是患者队列选择和招募机制,未能及时将最适合的患者带到试验中,以及缺乏技术基础设施(可靠有效的依从性控制、患者监测、和临床终点检测系统)运行试验。然而,AI可以用来克服这些缺点。
ML和DL都可以用来在大数据集中自动找到模式的意义,如文本、语音或图像(图2)。人机界面(HMI)是人类与器械之间的直接通信途径,允许计算机与人类之间的信息交换,NLP可以理解并关联书面或口语内容。AI中使用的所有这些方法均可用于关联大型和多样的数据集,如EHR、医学文献和试验数据库,以改善试验开始前的患者-试验匹配和招募,以及在试验期间自动和连续监测患者。
支持向量机(SVM)是一种ML模型,用于根据临床特征预测疾病。它是一种有用的工具,有可能用于临床试验的队列选择。在2019年的一项试点研究中,研究人员使用SVM和其他ML模型预测了2015年至2017年间威尔康奈尔医学和纽约长老会医院患者的产后抑郁症(PPD)。他们使用了EHR的数据,并确定人种、肥胖、焦虑、抑郁、不同类型的疼痛、抗抑郁药和妊娠期间抗炎药物为显著预测因素。PPD是分娩后最常见的母体疾病之一,具有严重影响,目前,缺乏有效的筛查策略和高质量的临床试验。因此,使用SVM可以利用EHR的大量详细患者数据,允许预测PPD和实施有效的临床决策支持干预。
AI在临床试验中一个很有前途的方法是智能助理,如亚马逊的Alexa、谷歌的助手、微软的Cortana和苹果的Siri。例如,它们可用于五个不同特征类别的糖尿病足溃疡(DFU)管理:(1)患者-医生界面(便于安排预约、重新提交药物等);(2)患者-护理人员界面(它们可支持患者与其正式和非正式护理人员之间的沟通);(3)警报/通知(他们可以及时发出警报或通知,以改善患者生活方式和/或让患者参与规定的护理管理计划);(4)自我护理(他们可以回答患者关于如何继续进行的问题,如果他们的脚有一些不寻常的特征);(5)游戏化(通过发送关于其改进的通知,使患者参与定期自我护理)。
05AI能否撰写科学和生物医学文章?
高质量出版物是研究人员成功的决定因素。此外,这些因素影响着研究人员目前和未来的工作前景。然而,撰写成功的出版物需要多种技能,包括分析和数据收集、写作,甚至伦理。由此可见,研究人员往往很难找到时间撰写科学文章并使其发表。即使是完全参与研究的人,专门用于写作过程的时间也可能很少。此外,以计算机形式或纸质形式进行学术写作的常用方法可能耗时。
科学文章的口述被公认为是产生高质量文章初稿的一种高效方法,Pommergard等展示了使用语音识别软件(VRS)转录口述科学文章的可行性。该研究组使用的过程最初包括详细的概述(“文章地图”),随后通过智能手机通过听写撰写手稿。除了具有时效性、产生高质量、简明的文章、不需要用户大量的学术经验外,该系统可以成为提高学术写作效率的一种方式。
06AI应用于移动应用开发:CogniAction案例
在技术的帮助下,残疾儿童的认知和运动发展每天都在提高。这种改善的主要影响是在教学互动和对这些儿童的社会包容。带有触摸屏的移动设备的不断改进,加上使用AI的软件的开发,正在改变收集、存储、分发和分析数据的方式,使新的发现成为可能。可访问性、用户界面(UI)和用户体验(UX)存在于大多数研究项目中,是大多数生产技术的行业投资的原因。在游戏市场的推动下,许多科学应用都是基于游戏化和玩游戏化的原则来实现它们的目标。游戏可及性有三个分类亚组:技术可及性、游戏内容的可及性、游戏界面的可及性。
在构建的案例研究中,专门针对移动设备,为唐氏综合征和神经问题儿童开发了的CogniAction app(图3)。在这种情况下,儿童、父母和特殊教育专业人员表明,在应用的帮助下,对感觉、知觉、认知和精神运动功能的评价对于识别运动困难和神经发育障碍儿童的神经心理特征至关重要。大量信息,如触摸间隔时间、不同物体或外部物体的触摸精度、屏幕上物体数量和物体大小,被翻译成测量空间智力、视觉注意力、短时记忆、工作记忆、手动处理速度和视觉-运动协调的数据,允许专家进行监测。因此,AI结合开发残疾人的具体应用,也为改善他们的生活条件和社会包容提供了一种宝贵的方式,以尊严和公平的方式对待他们。

图3. CogniAction app的流程描述
07结论
AI不再只是电影和书籍中的科幻小说:它是一个可以通过移动设备上的语音命令访问的现实。AI领域取得的进展彻底改变了人类知识的多个领域,它将对生命科学部门产生重大影响,正如目前冠状病毒大流行所见证的那样。除了对病例或死亡数量的预测外,机器正在被“教导”识别可用于疾病早期诊断的模式,如COVID-19。另一个例子是与移动设备和AI工具相关的游戏化如何帮助改善残疾人的生活(如CogniAction案例研究所示)。
此外,研究人员正在探索AI开发新的或再利用的药物,允许新的、更准确的药物处方。AI也被用于克服与临床试验相关的两大问题:患者队列选择和招募机制。使用ML,收集数据,分析,甚至通过听写和语音识别可以发表科学文章。毫无疑问,AI将继续在提高医疗和生命科学领域的准确性和降低成本方面取得巨大进步。
参考文献:
Michel L. Leite, Lorena S. de Loiola Costa, Victor A. Cunha, Victor Kreniski, Mario de Oliveira Braga Filho, Nicolau B. da Cunha, Fabricio F. Costa,Artificial intelligence and the future of life sciences,Drug Discovery Today,Volume 26, Issue 11,2021,Pages 2515-2526
版 权 信 息
本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号plgrace)进行删改处理。
原创内容未经授权,禁止转载至其他平台。有问题可发邮件至pengli@stonewise.cn
评论留言