【技术实现步骤摘要】
一种新型冠状病毒知识图谱模拟疫情发展趋势的预测方法
本专利技术涉及语义分析
,具体来说是一种新型冠状病毒知识图谱模拟疫情发展趋势的预测方法。
技术介绍
知识图谱描述知识之间的语义关联,新型冠状病毒知识图谱则以病毒、细菌为主体,包括病毒、细菌、流行病、传染病等相关实体,扩展了治疗、疾病等相关内容。新型冠状病毒知识图谱中节点关系复杂,不同节点的邻居节点集合可能相互包含了许多相同的节点,而且,从头节点到尾节点之间也可能存在成百上千可达路径。因此,在进行新型冠状病毒疫情发展趋势预测时,相同节点在处理不同节点的邻居节点时会被重复进行检索递归处理,同时,也难以从众多复杂的可达路径中获得较为准确的疫情发展趋势。这样,不但会增加大量的冗余存储空间而且需要多次重复检索图谱数据,遍历新型冠状病毒知识图谱时十分耗时。另外,考虑到以大规模实体和关系构建无向图模型的新型冠状病毒知识图谱,不管是实体之间的相关性度量,还是关系路径挖掘都是很困难的,最终仍会导致效率严重降低。同时,传统的有向图模型表示且仅考虑两跳以内的关系路径,没有考 ...
【技术保护点】
1.一种新型冠状病毒知识图谱模拟疫情发展趋势的预测方法,其特征在于,包括以下步骤:/n11)新型冠状病毒知识图谱的获取和预处理:获取新型冠状病毒知识图谱,并对其统一整理为三元组形式,三元组形式为{实体1,关系,实体2};/n12)关系子图的抽取:基于复杂网络理论技术进行关系子图抽取;/n13)新型冠状病毒疫情传播路径的分析:基于关系子图对新型冠状病毒疫情传播路径的可达性进行分析,获得知识图谱疫情发展趋势预测结果。/n
【技术特征摘要】
1.一种新型冠状病毒知识图谱模拟疫情发展趋势的预测方法,其特征在于,包括以下步骤:
11)新型冠状病毒知识图谱的获取和预处理:获取新型冠状病毒知识图谱,并对其统一整理为三元组形式,三元组形式为{实体1,关系,实体2};
12)关系子图的抽取:基于复杂网络理论技术进行关系子图抽取;
13)新型冠状病毒疫情传播路径的分析:基于关系子图对新型冠状病毒疫情传播路径的可达性进行分析,获得知识图谱疫情发展趋势预测结果。
2.根据权利要求1所述的一种新型冠状病毒知识图谱模拟疫情发展趋势的预测方法,其特征在于,所述关系子图的抽取包括以下步骤:
21)采用复杂网络理论获取新型冠状病毒知识图谱的最大连通子网节点集合;
22)根据获得的最大连通子网的节点集合MaxSubNet从新型冠状病毒知识图谱中提取最大子网的边的集合,其中每条边仍采用新型冠状病毒知识图谱中三元组形式存储在文本文件EGraph中;
23)由最大连通子网的节点集合MaxSubNet和文本文件EGraph生成最大连通子网,
其中,中心层由两个节点构成,这两个节点是各三元组对应的节点对中度值和最大的节点对;第二层为中心层各节点的邻居节点的集合;第三层为第二层的各节点的邻居节点的集合,以此类推,直到最大连通子网的最外层。
3.根据权利要求1所述的一种新型冠状病毒知识图谱模拟疫情发展趋势的预测方法,其特征在于,所述新型冠状病毒疫情传播路径的分析包括以下步骤:
31)计算节点之间相关性概率:
设R(vi,vj)表示节点vi和vj之间的相关性,C(vi,vj)表示在数据集中vi和vj同时出现的次数,C(vi)表示vi在数据集中出现的次数,其计算公式如下:
32)在无向图中构造节点团来量化节点直接的相关性,与节点直接或间接连接的边越多,与该节点的相关性越大;两个节点间隔的距离越...
【专利技术属性】
技术研发人员:赵明亮,李文波,吴雪莲,徐海环,云晨,赵大海,
申请(专利权)人:中科院合肥技术创新工程院,中国人民武装警察部队特色医学中心,安徽医科大学第二附属医院,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。