基于混合算法的医疗文献检索方法技术

技术编号：36503586 阅读：18 留言：0更新日期：2023-02-01 15:27

本发明专利技术公开了一种基于混合算法的医疗文献检索方法，对查询词进行扩展，采用改进的BM25算法作为一次检索的基础算法，根据标准化得分降序排序得出检索文献；对一次检索得到的文献进行基于聚类的摘要提取，采用基于Biobert模型的摘要、标题与检索任务的相似度匹配方法计算摘要相似度得分与标题相似度得分；将一次检索得到的文献的得分标准化，使其与标题相似度得分与摘要相似度得分处于同一等级，将三种得分相加并降序排序输出最后的检索结果。本发明专利技术所述的基于混合算法的医疗文献检索方法，在检索的两大指标P@10、R

全部详细技术资料下载

【技术实现步骤摘要】
基于混合算法的医疗文献检索方法

[0001]本专利技术涉及医疗数据信息检索领域，尤其涉及一种基于混合算法的医疗文献检索方法。

技术介绍

[0002]精准医疗是将现代科学技术手段与传统医学方法相结合，科学地细化人体功能和疾病性质，系统优化人类疾病预防和保健的原则和做法，以有效、安全、经济的医疗服务实现个人和社会健康效益最大化的一种新的医学范式。在精准医疗中，为每个患者选择适当的诊断方法，以实现最小的医源性损害，最小的医疗成本和患者最佳的康复。随着医疗技术的进步，生物医学文章的数量呈指数级增长。在海量文章数据库中找到与患者症状相匹配的相关文章变得越来越困难。
[0003]因此，本专利技术提供一种基于混合算法的医疗文献检索方法。

技术实现思路

[0004]为解决现有技术中存在的不足，本专利技术的目的在于，提供一种基于混合算法的医疗文献检索方法。
[0005]为实现本专利技术的目的，本专利技术所采用的技术方案是：
[0006]一种基于混合算法的医疗文献检索方法，包括以下步骤：
[000...

【技术保护点】

【技术特征摘要】
1.一种基于混合算法的医疗文献检索方法，其特征在于，包括以下步骤：(1)对查询词进行扩展，采用改进的BM25算法作为一次检索的基础算法，根据标准化得分降序排序得出检索文献；(2)对一次检索得到的文献进行基于聚类的摘要提取，采用基于Biobert模型的摘要、标题与检索任务的相似度匹配方法计算摘要相似度得分与标题相似度得分；(3)将一次检索得到的文献的得分标准化，使其与标题相似度得分与摘要相似度得分处于同一等级，将三种得分相加并降序排序输出最后的检索结果排序列表。2.根据权利要求1所述的基于混合算法的医疗文献检索方法，其特征在于，步骤(1)中，将病人信息输入到医学数据库中获取查询扩展信息，将病人信息与查询扩展信息输入到改进的BM25算法之中得出摘要得分、词得分和共现得分，将三种得分进行标准化相加并按分值降序排序得出检索文献；病人信息包含疾病、基本信息、基因和其他。3.根据权利要求1所述的基于混合算法的医疗文献检索方法，其特征在于，步骤(1)中，改进的BM25算法为：(1.1)定义摘要得分：其中，IDF为检索语素q
i
的IDF分数，k1、b1为调整因子，fi为qi的频率在d中，qfi是qi在query中出现的频率，dl是文档d的文本长度，avgdl是所有文档的平均文本长度；(1.2)提出一个词列表wordlist用于合并一个检索文档的chemical words,MeSH headings,keywords，并对其得分定义如下：其中，tfw为每个检索语素的IDF值之和，k1、b1为调整因子，dwl是文档d的wordlist的单词数量，avgdwl是所有文档的wordlist平均单词数量；(1.3)定义共现得分，即检索语素中的疾病与基因，在摘要和wordlist中共同出现的话，记作共现...

【专利技术属性】
技术研发人员：张子成，曹伟，
申请(专利权)人：南京汇宁桀信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人