来源:erurekalert
佛罗里达大学(University of Florida)和英伟达(NVIDIA)的研究人员共同开发的一种新的人工智能计算机程序可以很好地生成医生的笔记,以至于两名医生都无法分辨出其中的区别。
在这项概念验证研究中,医生审查了病人的笔记——一些是由真正的医生写的,而另一些是由新的人工智能程序创建的——医生识别出正确作者的准确率只有49%。
来自英伟达和佛罗里达大学的19名研究人员组成的团队表示,他们的研究结果发表在杂志《npj Digital Medicine》上,为人工智能以突破性的效率支持医护人员打开了大门。

图片信息:这些段落 引用了两个病人的案例,一个是人类写的,一个是GATORTRONGPT创建的,你能分辨作者是机器还是人类吗? 。
研究人员训练超级计算机基于一种新模型GatorTronGPT生成医疗记录,该模型的功能与ChatGPT类似。GatorTron™模型的免费版本在开源人工智能网站“Hugging Face”上的下载量超过43万次。据该文章的主要作者、佛罗里达大学医学院健康结果和生物医学信息系的Yonghui Wu博士介绍,GatorTron™模型是该网站唯一可用于临床研究的模型。
“在医疗保健领域,每个人都在谈论这些模式。GatorTron™和GatorTronGPT是独特的人工智能模型,可以为医学研究和医疗保健的许多方面提供动力。然而,它们需要大量的数据和广泛的计算能力来构建。我们很感激能有英伟达的超级计算机hypergator来探索人工智能在医疗保健领域的潜力。”
佛罗里达大学校友、英伟达(NVIDIA)联合创始人Chris Malachowsky以他的名字命名了佛罗里达大学新的数据科学与信息技术马拉考斯基大厅。佛罗里达大学和英伟达之间的公私合作伙伴关系为这个1.5亿美元的结构提供了资金。2021年,佛罗里达大学利用英伟达价值数百万美元的基础设施包,将其超级计算机HiPerGator升级为精英级计算机,这在大学里是第一次。
在这项研究中,Wu和他的同事开发了一个大型语言模型,使计算机能够模仿自然的人类语言。这些模型可以很好地处理标准的写作或对话,但医疗记录带来了额外的障碍,比如需要保护患者的隐私,而且技术水平很高。数字医疗记录不能在谷歌上搜索或在维基百科上共享。
为了克服这些障碍,研究人员从佛罗里达大学医疗记录中提取了200万名患者的识别信息,同时保留了820亿个有用的医学词汇。将这组数据集与另一个1950亿字的数据集相结合,他们训练GatorTronGPT模型,用GPT-3架构或生成预训练变压器(一种神经网络架构)来分析医疗数据。这使得GatorTronGPT能够写出类似于医生笔记的临床文本。
“这款GatorTronGPT模型是佛罗里达大学在全校范围内整合人工智能的首批主要产品之一。我们很高兴与英伟达的合作已经取得成果,并为医学的未来奠定了基础,” Elizabeth Shenkman博士说,她是佛罗里达大学健康结果和生物医学信息学部门的共同作者和主席。
在医疗GPT的许多可能用途中,一个想法是用人工智能记录和转录的笔记取代单调的文档。Wu说,佛罗里达大学有一个创新中心,正在开发该软件的商业版本。
为了让人工智能工具达到与人类写作相当的水平,程序员需要花费数周时间为超级计算机编写基于数十亿个单词的临床词汇和语言用法的程序。提供必要临床数据的一个资源是OneFlorida+临床研究网络,在UF协调并代表许多医疗保健系统。
“至关重要的是,不仅要有如此大量的UF健康临床数据,而且要为人工智能做好准备。只有超级计算机才能处理如此庞大的2770亿个单词的数据集。我们很高兴将GatorTron™和GatorTronGPT模型应用到UF health的现实医疗保健中,”合著者、UF health首席数据科学家和首席研究信息 Jiang Bian博士说。
14名UF和UF健康教师的横截面为这项研究做出了贡献,其中包括来自研究计算的研究人员,临床和转化科学研究所内的集成数据存储库研究服务,以及医学院内的部门和部门,包括神经外科,内分泌学,糖尿病和代谢,心血管医学,健康结果和生物医学信息学。
这项研究的部分资金来自以患者为中心的结果研究所、国家癌症研究所和国家老龄化研究所。
期刊:npj Digital Medicine
DOI:10.1038/s41746-023-00958-w
评论留言