支持双语输入的疾病循证方法、系统、存储介质及终端技术方案

技术编号:38833393 阅读:14 留言:0更新日期:2023-09-17 09:51
本发明专利技术公开了支持双语输入的疾病循证方法、系统、存储介质及终端,属于疾病诊断技术领域,包括:S1、构建疾病词库以及症状体征词库;S2、根据所述疾病词库以及症状体征词库构建具备疾病主题词和症状主题词的文献库;S3、对用户输入的内容进行拆分及中英转换;S4、将拆分前的检索式、拆分后关键词及其英文翻译词,作为检索词,分别遍历文献库中的症状中英文主题词,进行相似度匹配;S5、根据所述相似度匹配度返回相关的疾病数据。本发明专利技术在支持双语检索的同时,能够快速获得准确的疾病推断,且提供疾病循证文献,对于未来的疾病推断具有重大意义和价值。和价值。和价值。

【技术实现步骤摘要】
支持双语输入的疾病循证方法、系统、存储介质及终端


[0001]本专利技术涉及疾病诊断
,尤其涉及支持双语输入的疾病循证方法、系统、存储介质及终端。

技术介绍

[0002]疾病诊断是临床决策过程中是极其重要的步骤之一,临床症状常被作为疾病推断的重要信息。现有的疾病诊断系统多缺乏循证文献支撑,医务工作者临床工作中遇到不熟悉的疾病时,仍然会选择,检索医学文献获取疾病推断,这种传统方式虽然准确。但随着循证医学几十年的发展,医学文献的爆发式增长,想要从海量的文献中获取症状相关疾病的文献,是非常耗时耗力的。一方面,目前大部分国际权威文献数据库仅支持英文检索,传统方式在检索时需要构建包含症状的标准英文描述及同义词、缩写词的检索式。另一方面,传统方式检索出的文献可能是极其大量的,如果目标症状可能相关于多种疾病,而目标疾病相关文献较少的情况下更是很难快速获得准确的疾病推断。因此,检索方便、推论直接精准、数据权威且遵循循证的疾病推断方法是十分有意义和价值的。

技术实现思路

[0003]本专利技术的目的在于克服现有疾病诊断系统存在的问题,提供了支持双语输入的疾病循证方法、系统、存储介质及终端。
[0004]本专利技术的目的是通过以下技术方案来实现的:第一方面,提供一种支持双语输入的疾病循证方法,所述方法包括以下步骤:S1、构建疾病词库以及症状体征词库;S2、根据所述疾病词库以及症状体征词库构建具备疾病主题词和症状主题词的文献库;S3、对用户输入的内容进行拆分及中英转换;S4、将拆分前的检索式、拆分后关键词及其英文翻译词,作为检索词,分别遍历文献库中的症状中英文主题词,进行相似度匹配;S5、根据所述相似度匹配的结果返回相关的疾病数据。
[0005]作为一优选项,一种支持双语输入的疾病循证方法,所述构建疾病词库包括:采集、抽取一体化医学语言系统中疾病英文名称、疾病英文同义词、UMLS编码、MESH编码以及疾病英文概述数据;采集、抽取中国生物医学文献服务系统中疾病中文名称、疾病中文同义词、MESH编码以及疾病中文概述数据;通过MESH编码将两个系统中的数据进行匹配,组成疾病词库;通过基于OpenNMT的翻译算法模型翻译缺少中文的疾病名称数据。
[0006]作为一优选项,一种支持双语输入的疾病循证方法,所述构建疾病词库还包括:采集、抽取罕见病Orphanet数据库疾病名称、MESH编码、UMLS编码;
疾病的UMLS编码或MESH编码与罕见病Orphanet数据库的UMLS编码或MESH编码匹配上的数据,标记为罕见病。
[0007]作为一优选项,一种支持双语输入的疾病循证方法,构建症状体征词库,包括:采集、抽取人类表型本体、罕见病Orphanet数据库和中文人类表型本体的疾病名称、疾病症状名称、症状HP编码以及发生频率;通过基于OpenNMT的翻译算法模型补充缺少中文对应词的数据;采集国内在线问诊网站疾病描述数据,通过分词模型和预先训练的症状体征分析算法模型补充症状体征词;将算法模型提取的症状体征词与症状词库进行模糊匹配,映射补充为症状体征同义词。
[0008]作为一优选项,一种支持双语输入的疾病循证方法,所述步骤S2包括:通过对文献篇名、摘要、关键词和主题词进行清洗,生成文献疾病英文主题词、症状英文主题词、疾病中文主题词、症状中文主题词、疾病主题词id以及症状主题词id。
[0009]作为一优选项,一种支持双语输入的疾病循证方法,所述步骤S4包括:检索词与文献库内字段数据完全相同的,相似度为100%,检索词被包含在文献库内字段数据中时,相似度>0,检索词未被包含在文献库内字段数据中时,相似度=0。
[0010]作为一优选项,一种支持双语输入的疾病循证方法,所述步骤S5包括:提取相似度大于0的数据为结果数据;将结果数据先按照相似度的大小进行排序,再按照关联的症状词的频率由高频到低频的顺序返回疾病数据。
[0011]第二方面,提供一种支持双语输入的疾病循证系统,所述系统包括:词库构建模块,配置为构建疾病词库以及症状体征词库;文献库构建模块,配置为根据所述疾病词库以及症状体征词库构建具备疾病主题词和症状主题词的文献库;检索式构建模块,配置为对用户输入的内容进行拆分及中英转换;相似度匹配模块,配置为将拆分前的检索式、拆分后关键词及其英文翻译词,作为检索词,分别遍历文献库中的症状中英文主题词,进行相似度匹配;疾病数据筛选模块,配置为根据所述相似度匹配的结果返回相关的疾病数据。
[0012]第三方面,提供一种计算机存储介质,其上存储有计算机指令,所述计算机指令运行时执行任意一项所述一种支持双语输入的疾病循证方法中相关步骤。
[0013]第四方面,提供一种终端,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令,处理器运行计算机指令时执行任意一项所述一种支持双语输入的疾病循证方法中相关步骤。
[0014]需要进一步说明的是,上述各选项对应的技术特征在不冲突的情况下可以相互组合或替换构成新的技术方案。
[0015]与现有技术相比,本专利技术有益效果是:(1)本专利技术构建疾病词库、症状体征词库,通过模型对文献篇关摘进行清洗,生成疾病、症状体征、文献关联数据库以及检索模型,并通过相似度筛选的方式能够从海量的文献中获取症状相关疾病的文献,在支持双语检索的同时,检索方便、推论直接精准、数据权
威且遵循循证,能够快速获得准确的疾病推断,且提供疾病循证文献,对于未来的疾病推断具有重大意义和价值。
[0016](2)在一个示例中,本专利技术对罕见病的数据进行标记,能够对罕见病的数据进行准确定位。
[0017](3)在一个示例中,本专利技术利用罕见病Orphanet数据库、HPO英文数据库的英文症状词以及CHPO中文数据库进行中文翻译补充,没有翻译的症状词用翻译算法模型补充中文,人工校正算法翻译的症状词,再使用算法对在线问诊数据进行分词,获得中文语境下描述症状的词。最后用模糊匹配的方式将中文语境下的症状词与标准数据库的症状词进行关联,获得适用于中文使用习惯的,不受限于医院病历数据量的、不限制科室的、中英文双语症状词库,较传统方法更加全面、准确、方便,同时效率更高。
[0018](4)在一个示例中,本专利技术将结果数据以先相似度优先,症状频率次之的顺序返回疾病数据,提高疾病循证检索的准确度。
附图说明
[0019]图1为本专利技术示出的一种支持双语输入的疾病循证方法的流程示意图;图2为本专利技术示出的根据相似度返回疾病数据的示意图。
具体实施方式
[0020]下面结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0022]参照图1,在一示例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种支持双语输入的疾病循证方法,其特征在于,所述方法包括以下步骤:S1、构建疾病词库以及症状体征词库;S2、根据所述疾病词库以及症状体征词库构建具备疾病主题词和症状主题词的文献库;S3、对用户输入的内容进行拆分及中英转换;S4、将拆分前的检索式、拆分后关键词及其英文翻译词,作为检索词,分别遍历文献库中的症状中英文主题词,进行相似度匹配;S5、根据所述相似度匹配的结果返回相关的疾病数据。2.根据权利要求1所述的一种支持双语输入的疾病循证方法,其特征在于,所述构建疾病词库包括:采集、抽取一体化医学语言系统中疾病英文名称、疾病英文同义词、UMLS编码、MESH编码以及疾病英文概述数据;采集、抽取中国生物医学文献服务系统中疾病中文名称、疾病中文同义词、MESH编码以及疾病中文概述数据;通过MESH编码将两个系统中的数据进行匹配,组成疾病词库;通过基于OpenNMT的翻译算法模型翻译缺少中文的疾病名称数据。3.根据权利要求2所述的一种支持双语输入的疾病循证方法,其特征在于,所述构建疾病词库还包括:采集、抽取罕见病Orphanet数据库疾病名称、MESH编码、UMLS编码;疾病的UMLS编码或MESH编码与罕见病Orphanet数据库的UMLS编码或MESH编码匹配上的数据,标记为罕见病。4.根据权利要求1所述的一种支持双语输入的疾病循证方法,其特征在于,构建症状体征词库,包括:采集、抽取人类表型本体、罕见病Orphanet数据库和中文人类表型本体的疾病名称、疾病症状名称、症状HP编码以及发生频率;通过基于OpenNMT的翻译算法模型补充缺少中文对应词的数据;采集国内在线问诊网站疾病描述数据,通过分词模型和预先训练的症状体征分析算法模型补充症状体征词;将算法模型提取的症状体征词与症状词库进行模糊匹配,映射补充为症状体征同义词。5.根据权利要求1所述...

【专利技术属性】
技术研发人员:万虹杨柳青王中健
申请(专利权)人:药融云数字科技成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1