结合知识图谱的中医典籍语义分析方法及系统技术方案

技术编号:39773354 阅读:7 留言:0更新日期:2023-12-22 02:22
本公开提供了结合知识图谱的中医典籍语义分析方法及系统,涉及语义分析技术领域,该方法包括:采集获取目标中医典籍数据,得到原始中医典籍文字;构建第一知识图谱,对原始中医典籍文字进行异形自识别并替换,获得第一修正中医典籍文字;采集获取第一古汉语样本集合和现代汉语样本集合;获得第二知识图谱;进行现代汉语转换,得到第一转换文字;得到目标典籍类型,组成语义分析结果

【技术实现步骤摘要】
结合知识图谱的中医典籍语义分析方法及系统


[0001]本公开涉及语义分析
,具体涉及结合知识图谱的中医典籍语义分析方法及系统


技术介绍

[0002]中医典籍中蕴含着大量宝贵的重大疾病防治康养知识

但由于语义复杂,对疾病防治康养知识的挖掘

整理非常困难

且由于缺乏知识转化

应用的手段,疾病防治康养知识应用于临床

指导临床实践的作用也非常有限

目前,现有的分析中医典籍语义的方法大多为人工进行分析,导致语义分析的效率低下

综上所述,现有技术中存在由于中医典籍语义分析精确度和效率较低,导致中医典籍的疾病防治知识的整理和应用效率较低的技术问题


技术实现思路

[0003]本公开提供了结合知识图谱的中医典籍语义分析方法及系统,用以解决现有技术中存在由于中医典籍语义分析精确度和效率较低,导致中医典籍的疾病防治知识的较低的整理和应用的效率较低的技术问题

[0004]根据本公开的第一方面,提供了结合知识图谱的中医典籍语义分析方法,包括:采集获取待进行语义分析的目标中医典籍数据,对所述目标中医典籍数据进行文字提取,得到原始中医典籍文字;基于异形字映射关联数据库构建第一知识图谱,对所述原始中医典籍文字进行异形自识别并替换,获得第一修正中医典籍文字;基于数据挖掘技术采集获取异形字校正后的第一古汉语样本集合和进行现代汉语转换后的现代汉语样本集合;根据所述现代汉语样本集合对所述第一古汉语样本集合进行词语关联关系识别,获得第二知识图谱;通过所述第二知识图谱对所述第一修正中医典籍文字进行现代汉语转换,得到第一转换文字;基于所述第一转换文字进行典籍类型识别得到目标典籍类型,以所述第一转换文字和目标典籍类型组成所述目标中医典籍数据的语义分析结果

[0005]根据本公开的第二方面,提供了结合知识图谱的中医典籍语义分析系统,包括:原始中医典籍文字获得模块,所述原始中医典籍文字获得模块用于采集获取待进行语义分析的目标中医典籍数据,对所述目标中医典籍数据进行文字提取,得到原始中医典籍文字;第一修正中医典籍文字获得模块,所述第一修正中医典籍文字获得模块用于基于异形字映射关联数据库构建第一知识图谱,对所述原始中医典籍文字进行异形自识别并替换,获得第一修正中医典籍文字;现代汉语样本集合获得模块,所述现代汉语样本集合获得模块用于基于数据挖掘技术采集获取异形字校正后的第一古汉语样本集合和进行现代汉语转换后的现代汉语样本集合;第二知识图谱获得模块,所述第二知识图谱获得模块用于根据所述现代汉语样本集合对所述第一古汉语样本集合进行词语关联关系识别,获得第二知识图谱;第一转换文字获得模块,所述第一转换文字获得模块用于通过所述第二知识图谱对所述第一修正中医典籍文字进行现代汉语转换,得到第一转换文字;语义分析结果获得模块,
所述语义分析结果获得模块用于基于所述第一转换文字进行典籍类型识别得到目标典籍类型,以所述第一转换文字和目标典籍类型组成所述目标中医典籍数据的语义分析结果

[0006]本公开中提供的一个或多个技术方案,至少具有如下技术效果或优点:根据本公开采用的通过采集获取待进行语义分析的目标中医典籍数据,对所述目标中医典籍数据进行文字提取,得到原始中医典籍文字;基于异形字映射关联数据库构建第一知识图谱,对所述原始中医典籍文字进行异形自识别并替换,获得第一修正中医典籍文字;基于数据挖掘技术采集获取异形字校正后的第一古汉语样本集合和进行现代汉语转换后的现代汉语样本集合;根据所述现代汉语样本集合对所述第一古汉语样本集合进行词语关联关系识别,获得第二知识图谱;通过所述第二知识图谱对所述第一修正中医典籍文字进行现代汉语转换,得到第一转换文字;基于所述第一转换文字进行典籍类型识别得到目标典籍类型,以所述第一转换文字和目标典籍类型组成所述目标中医典籍数据的语义分析结果,解决了现有技术中存在由于中医典籍语义分析精确度和效率较低,导致中医典籍的疾病防治知识的较低的整理和应用的效率较低的技术问题,实现提高语义分析精确度和效率的目标,达到提高中医典籍的疾病防治知识的整理和应用效率的技术效果

[0007]应当理解,本部分所描述的内容并非旨在标示本公开的实施例的关键或重要特征,也不用于限制本公开的范围

本公开的其他特征将通过以下的说明书而变得容易理解

附图说明
[0008]为了更清楚地说明本公开或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图

[0009]图1为本公开实施例提供的结合知识图谱的中医典籍语义分析方法的流程示意图

[0010]图2为本公开实施例结合知识图谱的中医典籍语义分析方法中对所述目标中医典籍数据进行文字提取的流程示意图

[0011]图3为本公开实施例提供的结合知识图谱的中医典籍语义分析系统的结构示意图

[0012]附图标记说明:原始中医典籍文字获得模块
11
,第一修正中医典籍文字获得模块
12
,现代汉语样本集合获得模块
13
,第二知识图谱获得模块
14
,第一转换文字获得模块
15
,语义分析结果获得模块
16。
具体实施方式
[0013]以下结合附图对本公开的示范性实施例作出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的

因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神

同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述

[0014]实施例一本公开实施例提供的结合知识图谱的中医典籍语义分析方法,兹参照图1作说明,
所述方法包括:本公开实施例提供的方法中包括:采集获取待进行语义分析的目标中医典籍数据,对所述目标中医典籍数据进行文字提取,得到原始中医典籍文字;具体地,目标中医典籍数据为中医典籍中提取的待进行语义分析的中医典籍数据

举例而言,中医典籍数据为任一典籍的治疗方法或药物功效数据

进一步地,对目标中医典籍数据进行文字提取,当文字提取失败时,对提取失败文字进行生僻字转化,得到原始中医典籍文字

[0015]基于异形字映射关联数据库构建第一知识图谱,对所述原始中医典籍文字进行异形自识别并替换,获得第一修正中医典籍文字;具体地,异形字为通假字和错别字

获得带有异形字的样本集合,并获取对异形字校正后的对应样本集合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
结合知识图谱的中医典籍语义分析方法,其特征在于,所述方法包括:采集获取待进行语义分析的目标中医典籍数据,对所述目标中医典籍数据进行文字提取,得到原始中医典籍文字;基于异形字映射关联数据库构建第一知识图谱,对所述原始中医典籍文字进行异形自识别并替换,获得第一修正中医典籍文字;基于数据挖掘技术采集获取异形字校正后的第一古汉语样本集合和进行现代汉语转换后的现代汉语样本集合;根据所述现代汉语样本集合对所述第一古汉语样本集合进行词语关联关系识别,获得第二知识图谱;通过所述第二知识图谱对所述第一修正中医典籍文字进行现代汉语转换,得到第一转换文字;基于所述第一转换文字进行典籍类型识别得到目标典籍类型,以所述第一转换文字和目标典籍类型组成所述目标中医典籍数据的语义分析结果
。2.
如权利要求1所述的方法,其特征在于,所述对所述目标中医典籍数据进行文字提取,包括:基于所述目标中医典籍数据的数据类型,设置结构化文字识别通道和非结构化文字识别通道;通过所述结构化文字识别通道和非结构化文字识别通道对所述目标中医典籍数据进行文字提取,获得第一文字提取结果,所述第一文字提取结果具有提取成功标识或提取失败标识;当所述第一文字提取结果具有提取失败标识时,启动人机交互模块,通过所述人机交互模块对所述目标中医典籍数据进行生僻字信息的补充;根据所述生僻字信息对所述结构化文字识别通道和非结构化文字识别通道进行反馈优化;利用反馈优化后的结构化文字识别通道和非结构化文字识别通道对所述目标中医典籍数据重新进行文字提取,获得所述原始中医典籍文字
。3.
如权利要求2所述的方法,其特征在于,所述方法还包括:通过所述人机交互模块对所述生僻字信息进行异形字分析和语义分析,获得异形字分析结果和语义分析结果;利用所述异形字分析结果和所述语义分析结果对所述第一知识图谱

第二知识图谱进行反馈优化
。4.
如权利要求1所述的方法,其特征在于,所述基于异形字映射关联数据库构建第一知识图谱,还包括:基于数据挖掘技术采集获取带有异形字的第二古汉语样本集合

异形字校正后的第三古汉语样本集合;基于所述第二古汉语样本集合提取异形字段集合,所述异形字段集合具有异形字标识;根据所述异形字段集合的异形字标识在所述第三古汉语样本集合提取对应的校正字,建立所述校正字与所述异形字段集合的映射关系,构建所述异形字映射关联数据库

5.
如权利要求4所述的方法,其特征在于,所述方法还包括:基于所述异形字映射关联数据库构建所述第一知识图谱;将所述...

【专利技术属性】
技术研发人员:李文友赵静沈新樊静朱琼尚卫兵尹杰
申请(专利权)人:南京大经中医药信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1