糖尿病足知识图谱生成方法、装置及可读存储介质制造方法及图纸

技术编号:24690230 阅读:28 留言:0更新日期:2020-06-27 09:57
本申请提供一种糖尿病足知识图谱生成方法、装置及可读存储介质,涉及数据处理技术领域。该方法包括:获取糖尿病足相关领域的疾病语料数据;从疾病语料数据中提取多个疾病实体;获取每个疾病实体的属性信息,属性信息用于表征每个疾病实体的特征信息;利用属性信息构建多个疾病实体之间的关联关系;基于关联关系创建所述糖尿病足的知识库;将糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成糖尿病足的知识图谱。该方案通过构建糖尿病足的知识库,然后将知识库与预先创建的知识图谱架构进行关联,从而生成知识图谱,这样在构建糖尿病足的知识图谱时,可直接基于知识图谱架构进行构建即可,如此可更加快速、更加方便地构建知识图谱。

Method, device and readable storage medium of knowledge map of diabetic foot

【技术实现步骤摘要】
糖尿病足知识图谱生成方法、装置及可读存储介质
本申请涉及数据处理
,具体而言,涉及一种糖尿病足知识图谱生成方法、装置及可读存储介质。
技术介绍
随着医疗系统与互联网的逐步结合,医疗系统依靠互联网得到了大力的发展。由于医疗数据越来越庞大,蕴含着许多有价值的信息资源,于是可以通过分析医疗数据来挖掘这些有价值的信息。医疗数据具有模式多态性、不完整性、时间性、冗余性和隐私性等特点,对数据挖掘工作构成了挑战,尤其其中的非结构化数据更是难以分析,所以针对结构化的医疗数据做数据挖掘,是医疗数据挖掘的一个突破口。知识图谱是一种结构化数据,利用知识图谱,可以方便地进行搜索、预测等操作。知识图谱与数据挖掘相结合,越来越受到人们的重视,在医学领域,主要依靠医生手动构建医疗知识图谱,但是,人工构建知识图谱的工作量非常大,需要耗费大量的人力资源。
技术实现思路
本申请实施例的目的在于提供一种糖尿病足知识图谱生成方法、装置及可读存储介质,用以改善现有技术中构建知识图谱工作量大的问题。第一方面,本申请实施例提供了一种糖尿病足知识图谱生成方法,所述方法包括:获取糖尿病足相关领域的疾病语料数据;从所述疾病语料数据中提取多个疾病实体;获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;利用所述属性信息构建所述多个疾病实体之间的关联关系;基于所述关联关系创建所述糖尿病足的知识库;将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。在上述实现过程中,通过构建糖尿病足的知识库,然后将知识库与预先创建的知识图谱架构进行关联,从而生成知识图谱,这样在构建各种疾病的知识图谱时,可直接基于知识图谱架构进行构建即可,如此可更加快速、更加方便地构建知识图谱。可选地,所述将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱,包括:将所述糖尿病足的知识库中的各个知识点添加到所述知识图谱架构中的相应节点中,生成所述糖尿病足的知识图谱。在上述实现过程中,直接将各个知识点添加到知识图谱架构中,可无需在创建知识图谱架构,从而可以快速生成糖尿病足的知识图谱。可选地,所述从所述疾病语料数据中提取多个疾病实体,包括:从所述疾病语料数据中提取多个初始疾病实体;对所述多个初始疾病实体进行筛选,获得筛选后的所述多个疾病实体。在上述实现过程中,对多个初始疾病实体进行筛选,以筛选掉不满足要求的实体,使得后续参与构建知识库的无用数据较少,构建的知识库更加准确。可选地,所述对所述多个初始疾病实体进行筛选,获得剩余的多个疾病实体,包括:统计每个初始疾病实体在所述疾病语料数据中出现的次数;将出现的次数小于预设次数的初始疾病实体从所述多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的所述多个疾病实体。在上述实现过程中,将出现次数小于预设次数的初始疾病实体删除,如此可剔除一些无用的疾病实体,使得剩余的疾病实体为有用的疾病实体。可选地,所述从所述疾病语料数据中提取多个疾病实体,包括:采用双向长短期记忆网络-条件随机场BILSTM-CRF模型识别所述疾病语料数据中的多个疾病实体。在上述实现过程中,采用BILSTM-CRF模型可准确且快速识别出疾病语料数据中的多个疾病实体。可选地,所述生成所述糖尿病足的知识图谱之后,还包括:利用同义词词林以及word2vec算法获取各个疾病实体以及属性信息的同义词;将所述同义词添加到所述糖尿病足的知识库中。在上述实现过程中,通过获取同义词,可对糖尿病足的知识库进行扩充,使得知识库的知识点更加丰富。可选地,所述生成所述糖尿病足的知识图谱之后,还包括:利用Neo4J以及MongoDB数据库存储所述糖尿病足的知识图谱,可便于对数据的搜索。可选地,所述生成所述糖尿病足的知识图谱之后,还包括:获取用户输入的有关所述糖尿病足的查询信息;基于所述查询信息从所述糖尿病足的知识图谱中查找与所述查询信息相关的疾病知识信息;将所述疾病知识信息输出给所述用户。在上述实现过程中,利用知识图谱进行信息搜索,可便于用户自助进行快速地疾病知识查询。第二方面,本申请实施例提供了一种糖尿病足知识图谱生成装置,所述装置包括:数据获取模块,用于获取糖尿病足相关领域的疾病语料数据;实体提取模块,用于从所述疾病语料数据中提取多个疾病实体;属性获取模块,用于获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;关系构建模块,用于利用所述属性信息构建所述多个疾病实体之间的关联关系;知识库获取模块,用于基于所述关联关系创建所述糖尿病足的知识库;知识图谱生成模块,用于将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。可选地,所述知识图谱生成模块,用于将所述糖尿病足的知识库中的各个知识点添加到所述知识图谱架构中的相应节点中,生成所述糖尿病足的知识图谱。可选地,所述实体提取模块,用于从所述疾病语料数据中提取多个初始疾病实体;对所述多个初始疾病实体进行筛选,获得筛选后的所述多个疾病实体。可选地,所述实体提取模块,用于统计每个初始疾病实体在所述疾病语料数据中出现的次数;将出现的次数小于预设次数的初始疾病实体从所述多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的所述多个疾病实体。可选地,所述实体提取模块,用于采用双向长短期记忆网络-条件随机场BILSTM-CRF模型识别所述疾病语料数据中的多个疾病实体。可选地,所述装置,还包括:知识库扩充模块,用于利用同义词词林以及word2vec算法获取各个疾病实体以及属性信息的同义词;将所述同义词添加到所述糖尿病足的知识库中。可选地,所述装置,还包括:存储模块,用于利用Neo4J以及MongoDB数据库存储所述糖尿病足的知识图谱。可选地,所述装置,还包括:信息查询模块,用于获取用户输入的有关所述糖尿病足的查询信息;基于所述查询信息从所述糖尿病足的知识图谱中查找与所述查询信息相关的疾病知识信息;将所述疾病知识信息输出给所述用户。第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结本文档来自技高网...

【技术保护点】
1.一种糖尿病足知识图谱生成方法,其特征在于,所述方法包括:/n获取糖尿病足相关领域的疾病语料数据;/n从所述疾病语料数据中提取多个疾病实体;/n获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;/n利用所述属性信息构建所述多个疾病实体之间的关联关系;/n基于所述关联关系创建所述糖尿病足的知识库;/n将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。/n

【技术特征摘要】
1.一种糖尿病足知识图谱生成方法,其特征在于,所述方法包括:
获取糖尿病足相关领域的疾病语料数据;
从所述疾病语料数据中提取多个疾病实体;
获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;
利用所述属性信息构建所述多个疾病实体之间的关联关系;
基于所述关联关系创建所述糖尿病足的知识库;
将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。


2.根据权利要求1所述的方法,其特征在于,所述将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱,包括:
将所述糖尿病足的知识库中的各个知识点添加到所述知识图谱架构中的相应节点中,生成所述糖尿病足的知识图谱。


3.根据权利要求1所述的方法,其特征在于,所述从所述疾病语料数据中提取多个疾病实体,包括:
从所述疾病语料数据中提取多个初始疾病实体;
对所述多个初始疾病实体进行筛选,获得筛选后的所述多个疾病实体。


4.根据权利要求3所述的方法,其特征在于,所述对所述多个初始疾病实体进行筛选,获得剩余的多个疾病实体,包括:
统计每个初始疾病实体在所述疾病语料数据中出现的次数;
将出现的次数小于预设次数的初始疾病实体从所述多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的所述多个疾病实体。


5.根据权利要求1所述的方法,其特征在于,所述从所述疾病语料数据中提取多个疾病实体,包括:
采用双向长短期记忆网络-条件随机场BILSTM-CRF模型识别所述疾病语料数据...

【专利技术属性】
技术研发人员:周秋红胡建中黄伟红赵楠许景灿祁敏刘耕苏郁唐睿易宜芳刘泽灏张江林周捷吴辽芳张其健
申请(专利权)人:中南大学湘雅医院中移成都信息通信科技有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1