中文论文


论文题名
基于Transformer的预训练语言模型在生物医学领域的应用
英文题名
作者
游至宇;阳倩;傅姿晴;陈庆超;李奇渊
作者单位
厦门大学医学院;健康医疗大数据国家研究院;北京大学健康医疗大数据国家研究院;跨媒体通用人工智能全国重点实验室
期刊名称
厦门大学学报(自然科学版)
CN号
ISSN
0438-0479
出版日期
2024-09-28
63
05
页码
883-893
中文关键词
自然语言处理;生物医学应用;预训练语言模型;多模态学习;医疗文本挖掘
英文关键词
中文摘要
[背景]随着人工智能技术的快速发展,自然语言处理(NLP)已成为生物医学研究领域中的一项关键技术.而基于Transformer框架的预训练语言模型(T-PLMs)已被广泛应用于生物医学文本的分析,有效地推动了临床决策支持系统的发展和基因组学数据的解读.[进展]本文聚焦于T-PLMs在生物医学领域的应用,探讨其在处理和理解生物医学文本数据方面的潜力和挑战.首先回顾NLP技术的演进,从传统的特征工程到预训练语言模型的兴起,特别是BERT等模型如何改变生物医学文本分析的范式;随后详细介绍T-PLMs的训练范式,包括预训练和微调过程,以及如何通过特定领域的预训练和Prompt工程来提升模型在生物医学任务中的性能;进而深入探讨T-PLMs在生物医学领域的多样化应用,包括文本表示和知识挖掘、临床决策支持、医学影像理解、蛋白质预测、分子表示和药物设计等,并特别归纳收集了上述多个生物医学细分领域相关的数据库资料.[展望]当前研究和应用中仍面临许多挑战,如模型可解释性、数据隐私保护、多模态数据等.基于此对未来的研究方向提出展望,以充分发挥NLP在推动生物医学研究和改善患者护理方面的潜力.
英文摘要
参考文献
基金
国家自然科学基金面上项目(82272944)

返回