一种脑卒中医疗知识图谱的构建方法技术

技术编号:27469403 阅读:30 留言:0更新日期:2021-03-02 17:33
本发明专利技术公开了一种脑卒中医疗知识图谱的构建方法,所述方法如下:S1、构建脑卒中疾病词典;S2、构建脑卒中本体库和脑卒中本体库的模式层,并生成模式层的规则;S3、从信息库中获取脑卒中疾病及其相关的医学知识并进行实体对齐和相似度计算,然后基于本体库模式层的规则添加到脑卒中本体库中;S4、不断重复步骤S3,以对脑卒中本体库进行更新和完善,进而可获得脑卒中医疗知识图谱;步骤S5、计算脑卒中医疗知识图谱中医学知识的置信度,并舍弃置信度低的医学知识以保证所获得的医疗知识图谱的质量。本发明专利技术中构建了一个覆盖全面、结构完整、知识描述准确的脑卒中医学知识图谱,为后续的脑卒中智能问答系统以及辅助决策系统奠定基础。中智能问答系统以及辅助决策系统奠定基础。中智能问答系统以及辅助决策系统奠定基础。

【技术实现步骤摘要】
一种脑卒中医疗知识图谱的构建方法


[0001]本专利技术属于医疗
,具体涉及了一种脑卒中医疗知识图谱的构建方法。

技术介绍

[0002]随着城市化进程和社会老龄化加速,脑卒中已经成为致死率和致残率第一的疾病,具有高发病率、高致残率、高死亡率、高复发率、高经济负担五大特点,在我国脑卒中防治报告2019中提到,2018年我国居民因脑血管病致死的比例超过20%,致死率长期居于首位且逐年上升。而目前对于脑卒中的研究主要集中在防治上,由于脑卒中涉及到多种并发症,治疗手段也很多,有关于脑卒中的医疗实体错综复杂,运用医疗知识图谱会对此起到积极作用,
[0003]从上个世纪九十年代的语义网络,到2012年Google正式提出知识图谱(Knowledge Graph),再发展到现在的公开知识库以及大量的通用知识图谱涌现,证明对于知识图谱的研究及应用已经在各行业各领域引起极大的关注,知识图谱可以简单的划分成通用知识图谱和领域知识图谱两类,通用知识图谱有很多,研究领域中的大型公开的知识库,如基于维基百科词条中抽取结构化知识的DBpedia、集成了部分中文信息的连接数据库YAGO、社区伙伴贡献的大型合作型知识库Freebase、中文的开放型知识图谱库OpenKG等;工程领域的谷歌公司用在Google搜索引擎上的的Knowledge Graph、百度公司用作百度搜索的知识图谱“知心”、搜狗用在Sougo搜索的“知立方”等。
[0004]得益于互联网技术的不断发展,知识的储存和共享愈发便捷,医疗领域知识能借助互联网相互交融、交叉发展,越来越多的技术被运用到医疗领域中,为智慧医疗领域添砖加瓦,而知识图谱本质上是一种揭示实体之间的关系的语义网络,网络中的节点代表着实体,节点间的边表示实体与实体间的关系,知识图谱在医疗领域的应用前景非常广阔,将知识图谱运用到医疗领域中的智能问答、疾病辅助诊断、风险评估以及决策系统等方面都能起到关键作用,医疗知识图谱蕴含大量疾病知识与症状特征,实体和概念覆盖面更广、语义关系更多样,能够作为机器语言认知的基础。
[0005]鉴于此,本专利技术以脑卒中及其相关医学知识作为契入点,对脑卒中知识图谱进行研究,提出了一种脑卒中医疗知识图谱的构建方法。

技术实现思路

[0006]本专利技术的目的是提供一种脑卒中医疗知识图谱的构建方法,构建了一个覆盖全面、结构完整、知识描述准确的脑卒中医学知识图谱,为后续的脑卒中智能问答系统以及辅助决策系统奠定基础。
[0007]为解决上述技术问题,本专利技术提供一种脑卒中医疗知识图谱的构建方法,所述方法包括以下步骤:
[0008]S1、基于国际标准医学术语集并通过人工参与的方式构建脑卒中疾病词典;
[0009]S2、根据脑卒中疾病词典构建脑卒中本体库和脑卒中本体库的模式层,并生成脑
卒中本体库模式层的规则;
[0010]S3、从信息库中获取脑卒中疾病及其相关的医学知识,并对获取的医学知识进行实体对齐和相似度计算,然后基于本体库模式层的规则将与脑卒中本体库中实体匹配的医学知识添加到脑卒中本体库中;
[0011]S4、不断重复步骤S3,以对脑卒中本体库进行更新和完善,进而可获得脑卒中医疗知识图谱。
[0012]优选地,所述步骤S1的具体实现方式包括:
[0013]S11、通过人工参与的方式调用国际标准医学术语集并初步建立概念分类体系;
[0014]S12、同时利用人工对所调用的国际标准医学术语集进行标注分析以建立关系分类体系;
[0015]S13、对所建立的概念分类体系和关系分类体系进行对比评估,从而构建脑卒中疾病词典。
[0016]优选地,所述步骤S3的具体实现方式包括:
[0017]S31、采用分布式爬虫从垂直医学网站和众包性质的百科网站中爬取脑卒中疾病及其相关的医学知识,并将所爬取的医学知识以三元组<head,relation,tail>形式储存在Neo4J图数据库中;
[0018]S32、将从公开知识库中获取的通用知识图谱医学知识直接进行整合,并将所整合的医学知识以三元组<head,relation,tail>形式储存在Neo4J图数据库中;
[0019]S33、将Neo4J图数据库中储存的从步骤S31和步骤S32获取的医学知识映射到连续的低维向量空间中并以实体向量表示以进行实体对齐,然后计算出实体之间的语义结构信息的相似度;
[0020]S34、基于本体库模式层的规则将所计算的相似度高的医学知识添加到脑卒中本体库中。
[0021]优选地,所述步骤S33的具体实现方式包括:
[0022]S331、利用TransD模型将Neo4J图数据库中储存的从步骤S31和步骤S32获取的医学知识映射到连续的低维向量空间中以实体向量表示,其中TransD模型表示为:
[0023][0024]式(1)中,h表示头实体节点,t表示尾实体节点,r表示头实体节点与尾实体节点之间的关系,L1/L2表示计算时使用L1的距离或使用L2的距离,L1表示r向量到h向量的平移距离,L2表示r向量到t向量的平移距离,其中,M
h
=r
p
h
p
+I,M
t
=r
p
t
p
+I,I表示单位矩阵,p表示投影,h
p
、r
p
、t
p
分别为三元组<head,relation,tail>的投影向量;
[0025]S332、将同类实体的相同属性的不同表达方式进行属性对齐得到异构数据源,然后根据本体库模式层的规则对异构数据源的属性值进行规范化处理;
[0026]S333、计算属性对齐和规范化处理后实体的语义结构信息的相似度,从而确定该医学知识中实体与脑卒中本体库中实体之间的关系,其计算公式表示为:
[0027][0028]式(2)中,W1,W2表示两个实体,k表示权重参数,N表示可调节参数,i,j表示实体的
属性名称,lcs(i,j)表示实体属性名称i和j的最大公共子序列的长度,l
i
表示实体W1中词的长度,l
j
表示实体W2中词的长度。
[0029]优选地,所述异构数据源的属性值进行规范化处理具体包括:对数值型属性值的度量单位进行统一;对字符串类型属性值中带有的空格符和换行符进行删除;将区间型属性值的上限和下限储存于列表中;将实体对象型属性值储存于列表中且不进行属性对齐操作。
[0030]优选地,所述脑卒中本体库中的实体包括基于医学主题词表和ICD-10编码。
[0031]优选地,所述步骤S3中的医学知识包括脑卒中疾病数据,以及治疗手段、症状、检查方法和药品。
[0032]优选地,所述步骤S4中通过人工干预的方式对所获得的脑卒中医疗知识图谱边界进行限定以保证脑卒中医疗本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种脑卒中医疗知识图谱的构建方法,其特征在于,所述方法包括以下步骤:S1、基于国际标准医学术语集并通过人工参与的方式构建脑卒中疾病词典;S2、根据脑卒中疾病词典构建脑卒中本体库和脑卒中本体库的模式层,并生成脑卒中本体库模式层的规则;S3、从信息库中获取脑卒中疾病及其相关的医学知识,对获取的医学知识进行实体对齐和相似度计算,然后基于本体库模式层的规则将与脑卒中本体库中实体匹配的医学知识添加到脑卒中本体库中;S4、不断重复步骤S3,以对脑卒中本体库进行更新和完善,进而可获得脑卒中医疗知识图谱。2.如权利要求1所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述步骤S1的具体实现方式包括:S11、通过人工参与的方式调用国际标准医学术语集并初步建立概念分类体系;S12、同时利用人工对所调用的国际标准医学术语集进行标注分析以建立关系分类体系;S13、对所建立的概念分类体系和关系分类体系进行对比评估,从而构建脑卒中疾病词典。3.如权利要求2所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述步骤S3的具体实现方式包括:S31、采用分布式爬虫从垂直医学网站和众包性质的百科网站中爬取脑卒中疾病及其相关的医学知识,并将所爬取的医学知识以三元组<head,relation,tail>形式储存在Neo4J图数据库中;S32、将从公开知识库中获取的通用知识图谱医学知识直接进行整合,并将所整合的医学知识以三元组<head,relation,tail>形式储存在Neo4J图数据库中;S33、将Neo4J图数据库中储存的从步骤S31和步骤S32获取的医学知识映射到连续的低维向量空间中并以实体向量表示以进行实体对齐,然后计算出实体之间的语义结构信息的相似度;S34、基于本体库模式层的规则将所计算的相似度高的医学知识添加到脑卒中本体库中。4.如权利要求3所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述步骤S33的具体实现方式包括:S331、利用TransD模型将Neo4J图数据库中储存的从步骤S31和步骤S32获取的医学知识映射到连续的低维向量空间中以实体向量表示,其中TransD模型表示为:式(1)中,h表示头实体节点,t表示尾实体节点,r表示头实体节点与尾实体节点之间的关系,L1/L2表示计算时使用L1的距离或使用L2的距离,L1表示r向量到h向量的平移距离,L2表示r向量到t向量的平移距离,其中,M
h
=r
p
h
p
+I,M
t
=r
p
t
p
+I,I表示单位矩阵,p表示投影,h
p
、r
p
...

【专利技术属性】
技术研发人员:张锦成斌杰刘宏李强汪飞
申请(专利权)人:湖南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1