【技术实现步骤摘要】
一种心脏病大数据知识图谱系统的构建方法
本专利技术属于数据挖掘领域,具体涉及一种心脏病大数据知识图谱系统的构建方法。
技术介绍
数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。今年来数据挖掘的应用越来越广泛,在各个领域都有很好的应用,但在医疗领域中,现有的技术提取知识节点的速度慢,并且逻辑性差,导致实用性大大降低。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的一种心脏病大数据知识图谱系统的构建方法解决了现有技术提取速度慢和逻辑性差的问题。为了达到上述专利技术目的,本专利技术采用的技术方案为:一种心脏病大数据知识图谱系统的构建方法,包括以下步骤:S1、采集心脏病基础数据,获取基础知识库;S2、将基础知识库的数据进行分类与联系,获取初始数据;S3、通过RNN神经网络对初始数据进行数据抽取,获取每条知识的实体、属性和关系,得到量化医学数据;S4、根据Dice系数法和Can ...
【技术保护点】
1.一种心脏病大数据知识图谱系统的构建方法,其特征在于,包括以下步骤:/nS1、采集心脏病基础数据,获取基础知识库;/nS2、将基础知识库的数据进行分类与联系,获取初始数据;/nS3、通过RNN神经网络对初始数据进行数据抽取,获取每条知识的实体、属性和关系,得到量化医学数据;/nS4、根据Dice系数法和Canopy算法,将量化医学数据整合,获取标准知识数据;/nS5、根据标准知识数据,获取知识图谱,构建知识图谱系统,并建立知识图谱系统的高速查询接口。/n
【技术特征摘要】
1.一种心脏病大数据知识图谱系统的构建方法,其特征在于,包括以下步骤:
S1、采集心脏病基础数据,获取基础知识库;
S2、将基础知识库的数据进行分类与联系,获取初始数据;
S3、通过RNN神经网络对初始数据进行数据抽取,获取每条知识的实体、属性和关系,得到量化医学数据;
S4、根据Dice系数法和Canopy算法,将量化医学数据整合,获取标准知识数据;
S5、根据标准知识数据,获取知识图谱,构建知识图谱系统,并建立知识图谱系统的高速查询接口。
2.根据权利要求1所述的心脏病大数据知识图谱系统的构建方法,其特征在于,所述步骤S2包括以下分步骤:
S2.1、对基础知识库中知识数据的总数进行统计,并计算最小支持度计数;
S2.2、依次判断每条知识数据的计数是否满足最小支持度,并将满足最小支持度的知识数据输出,得到若干频繁1项集;
S2.3、读取频繁k-1项集,根据剪枝算法产生频繁k项集,并计算频繁k项集的计数,k≥2;
S2.4、判断频繁k项集的计数是否满足最小支持度,若是则令k的计数值加1,并返回步骤S2.3,若否则输出频繁k项集;
S2.5、遍历所有频繁1项集,获取若干频繁k项集,得到初始化数据。
3.根据权利要求1所述的心脏病大数据知识图谱系统的构建方法,其特征在于,所述步骤S3包括以下分步骤:
S3.1、将初始化数据的每条数据进行数字化,得到实体;
S3.2、根据NLP技术,通过RNN神经网络抽取实体的属性和关系;<...
【专利技术属性】
技术研发人员:刘琦,周翔鸿,何婧婧,姚怡君,葛玲玲,吴铸衡,李登,陈茂,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。