System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于中国药典的中药饮片知识图谱的构建方法和系统技术方案_技高网

基于中国药典的中药饮片知识图谱的构建方法和系统技术方案

技术编号:40088559 阅读:6 留言:0更新日期:2024-01-23 15:50
本发明专利技术涉及基于中国药典的中药饮片知识图谱的构建方法和系统;该构建方法包括:从中国药典文献中获取中药饮片信息;获取中药饮片的属性信息和实例信息;构建实例节点集;构建中药饮片本体‑实例分类概念结构层次;构建属性关系;采用可视化的形式输出中药饮片知识图谱模型。本发明专利技术提供的图谱能够简洁地反映中药饮片的相关信息以及不同种类中药饮片之间的关联信息,便于深层次地了解中药中隐藏的知识,同时,将计算机领域先进的本体理念引入到中药知识研究中,构建中药饮片本体,能够实现中药饮片信息的知识化重组,进而为中药领域的数据挖掘和知识发现提供数据基础。

【技术实现步骤摘要】

本专利技术涉及医学大数据图谱,尤其涉及基于中国药典的中药饮片知识图谱的构建方法和系统


技术介绍

1、目前关于中药饮片的大多数知识及数据均是以书本、期刊文献或在网络上以半结构化或非结构化形式存储,缺乏较为直观的数据存储形式,较难在普通数据库中看出某几种中药饮片之间包括成分、产地、功效、性味归经等方面的联系,针对具体的研究目标并没有达成一致的解决方案,导致当前研究结果存在一定的差异,这在一定程度上限制了中医药领域知识的推广和利用。开放领域知识图谱大多是大规模的百科类知识库,缺乏限定领域的高质量知识图谱,特别是在中医药领域,迫切地需要知识图谱建模的策略和技术来实现多学科的深度融合。

2、目前主流的图数据库有美国neo technology机构开发的neo4j数据库、微软公司开发的graph engine数据库、北京大学开发的gstore数据库等。其中,目前最常用的图数据库是neo4j,该图数据库是一个成熟的高性能图引擎,支持分布式处理,同时对java平台具有较好的兼容性,该引擎具有成熟数据库的所有基本特性。为此,本专利技术提供基于中国药典的中药饮片知识图谱的构建方法,基于neo4j图数据库存储知识图谱三元组数据,以中药饮片作为研究对象,通过结构化、多模态的形式展示数据,能够更直观地掌握中药性质及功能主治间的关系,进而发现隐含的中药饮片用药规律和特征。

3、为此,本专利技术提供了基于中国药典的中药饮片知识图谱的构建方法和系统。


技术实现思路

1、基于此,有必要针对上述技术问题,提供基于中国药典的中药饮片知识图谱的构建方法和系统。

2、为了实现上述目的,本专利技术提供了基于中国药典的中药饮片知识图谱的构建方法,包括以下步骤:

3、从中国药典文献中获取中药饮片信息;

4、基于文本信息分布特性,通过excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息;

5、通过protégé工具加载中药饮片的实例信息,参考snomed ct概念模型构建实例节点集;

6、通过protégé工具参考snomed ct概念模型构建中药饮片本体-实例分类概念结构层次;

7、基于文本信息分布特性,加载中药饮片的实例信息中所包含的数据属性和对象属性,构建属性关系;

8、将protégé工具中的实例信息和属性关系存储到neo4j图数据库中,通过在neo4j图数据库中输入查询条件进行查询,得到符合条件的中药饮片知识图谱模型,并采用可视化的形式输出中药饮片知识图谱模型。

9、具体的,所述中国药典文献为2020年版《中国药典》(一部)。

10、具体的,所述中药饮片信息包括中药饮片名称、适应症、证候、治疗作用、炮制品、禁忌、归经、毒性、五味、四气、类别、科属、药用部位、采收时间、用药剂量、贮藏方式和活性成分。

11、具体的,所述基于文本信息分布特性,通过excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息,包括:

12、基于文本信息分布特性,根据符号特征和/或换行符分界线特征和/或关键词形式特征,采用excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息。

13、具体的,所述通过protégé工具加载中药饮片的实例信息,参考snomed ct概念模型构建实例节点集,包括:

14、基于nlp技术,对中药饮片的实例信息进行语义分析,通过protégé工具加载中药饮片的实例信息,参考snomed ct概念模型构建实例节点集,其中,实例节点集包括中药性能类实例节点集、临床发现类实例节点集和限定值类实例节点集。

15、具体的,所述数据属性表示实例信息与参数之间的关系,所述对象属性表示两个实例信息之间的关系。

16、具体的,所述将protégé工具中的实例信息和属性关系存储到neo4j图数据库中,通过在neo4j图数据库中输入查询条件进行搜索,得到符合条件的中药饮片知识图谱模型,并采用可视化的形式输出中药饮片知识图谱模型,包括:

17、将protégé工具中的实例信息和属性关系存储到neo4j图数据库中,通过neo4j图数据库的查询语言cypher构造查询条件进行查询,得到符合条件的中药饮片知识图谱模型,并采用可视化的形式输出中药饮片知识图谱模型。

18、本专利技术还提供了基于中国药典的中药饮片知识图谱的构建系统,包括:

19、数据获取模块,用于从中国药典文献中获取中药饮片信息;

20、文本属性拆分模块,用于基于文本信息分布特性,通过excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息;

21、实例节点集构建模块,用于通过protégé工具加载中药饮片的实例信息,参考snomed ct概念模型构建实例节点集;

22、结构层次构建模块,用于通过protégé工具参考snomed ct概念模型构建中药饮片本体-实例分类概念结构层次;

23、属性关系构建模块,用于基于文本信息分布特性,加载中药饮片的实例信息中所包含的数据属性和对象属性,构建属性关系;

24、可视化模块,用于将protégé工具中的实例信息和属性关系存储到neo4j图数据库中,通过在neo4j图数据库中输入查询条件进行查询,得到符合条件的中药饮片知识图谱模型,并采用可视化的形式输出中药饮片知识图谱模型。

25、本专利技术还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述构建方法的步骤。

26、本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述构建方法的步骤。

27、本专利技术的优点及有益效果在于:

28、本专利技术提供的基于中国药典的中药饮片知识图谱的构建方法和系统,该构建方法针对2020年版《中国药典》(一部)中的中药饮片信息进行分析和挖掘,提取得到用于构建中药饮片知识图谱模型的基础数据,通过对知识图谱模型中的顶层架构进行划分,得到知识图谱模型的层级架构和各级节点之间的关系,并存储于neo4j图数据库中,利用neo4j图数据库根据知识图谱模型的层级架构和各级节点之间的关系,构建基于2020年版《中国药典》(一部)的中药饮片知识图谱,该图谱能够简洁地反映中药饮片的相关信息以及不同种类中药饮片之间的关联信息,便于深层次地了解中药中隐藏的知识,同时,将计算机领域先进的本体理念引入到中药知识研究中,构建中药饮片本体,能够实现中药饮片信息的知识化重组,进而为中药领域的数据挖掘和知识发现提供数据基础。

本文档来自技高网...

【技术保护点】

1.基于中国药典的中药饮片知识图谱的构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述中国药典文献为2020年版《中国药典》(一部)。

3.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述中药饮片信息包括中药饮片名称、适应症、证候、治疗作用、炮制品、禁忌、归经、毒性、五味、四气、类别、科属、药用部位、采收时间、用药剂量、贮藏方式和活性成分。

4.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述基于文本信息分布特性,通过Excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息,包括:

5.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述通过Protégé工具加载中药饮片的实例信息,参考SNOMED CT概念模型构建实例节点集,包括:

6.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述数据属性表示实例信息与参数之间的关系,所述对象属性表示两个实例信息之间的关系。

7.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述将Protégé工具中的实例信息和属性关系存储到Neo4j图数据库中,通过在Neo4j图数据库中输入查询条件进行搜索,得到符合条件的中药饮片知识图谱模型,并采用可视化的形式输出中药饮片知识图谱模型,包括:

8.基于中国药典的中药饮片知识图谱的构建系统,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述构建方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述构建方法的步骤。

...

【技术特征摘要】

1.基于中国药典的中药饮片知识图谱的构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述中国药典文献为2020年版《中国药典》(一部)。

3.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述中药饮片信息包括中药饮片名称、适应症、证候、治疗作用、炮制品、禁忌、归经、毒性、五味、四气、类别、科属、药用部位、采收时间、用药剂量、贮藏方式和活性成分。

4.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述基于文本信息分布特性,通过excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息,包括:

5.根据权利要求1所述的基于中国药典的中药饮片知识图谱的构建方法,其特征在于,所述通过protégé工具加载中药饮片的实例信息,参考snomed ct概念模型构建实例节点集,包括:

6...

【专利技术属性】
技术研发人员:付涛涛陈艳梅陈敏弓孟春
申请(专利权)人:神州医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1