System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及知识图谱,尤其涉及用于名老中医经验活态传承的数字人知识图谱构建方法。
技术介绍
1、知识图谱
包含计算机科学、人工智能和数据管理多个领域,涉及通过图形化的方式表示和处理复杂的知识体系,核心内容包括知识的获取、建模、存储、查询、推理、可视化,知识图谱通过节点和边构成,即实体和实体间的相互关系,有效组织和管理大量的数据,并通过语义关系揭示信息之间的内在联系,应用场景包括智能问答、推荐系统、语义搜索,在知识图谱的构建过程中,涉及数据的抽取、知识的融合、图谱的优化及更新多种技术手段,用于支持更加智能化和精确的信息处理。
2、其中,名老中医经验活态传承的数字人知识图谱构建方法是指通过数字化手段对名老中医的医学知识和经验进行建模,构建专有的知识图谱,该专利主题针对的技术事项包括从名老中医的临床经验、治疗方法、药物使用多个方面提取知识,并以图谱形式进行组织和存储,具体而言,采用自然语言处理技术对名老中医的医疗记录、文献资料和多种文本数据进行分析,识别其中的实体和关系,采用知识抽取与图谱构建算法将知识点以结构化方式呈现,并结合中医诊疗过程中的多维信息进行全面建模,包括病症、症状、治疗方案,构建知识图谱,结合图谱的更新和维护,确保在活态传承过程中持续更新和完善,为中医领域提供更加系统化的知识管理和经验传承平台。
3、现有知识图谱构建方法在中医领域应用中存在多源异构数据整合不足的问题,文本分析与语音识别的割裂处理模式难以形成有效的知识互补机制,文献解析过程中缺乏对语法结构的深度挖掘,单纯依赖词频统计容易忽
技术实现思路
1、本专利技术的目的是解决现有技术中存在的缺点,而提出的用于名老中医经验活态传承的数字人知识图谱构建方法。
2、为了实现上述目的,本专利技术采用了如下技术方案:用于名老中医经验活态传承的数字人知识图谱构建方法,包括以下步骤:
3、s1:获取中医文献数据,对文献进行逐句拆解,将连续语句切割为独立的词汇单元,标注每个词汇在句子中的语法作用,通过分析相邻词汇间的组合规律,识别文本中的多项实体,生成文献实体集合;
4、s2:基于所述文献实体集合,获取名老中医的口述语音,将语音信号分割为多个语段并转换为文字符号序列,通过比对文字序列中相邻词语的搭配规律,对照文献中的多项实体,提取语音中的多项实体,输出语音识别实体列表;
5、s3:调用所述语音识别实体列表,对文本与语音来源的实体集合进行空间映射,分析跨文档的实体共现频率,通过分析语句层级的语法结构,识别多项实体间的相互关系,生成实体关系推导图;
6、s4:利用所述实体关系推导图,将实体转化为节点,关系转化为边,根据节点间的连接频次计算关联强度,对同义实体节点进行属性融合,结合医师反馈,实时更新连接关系,输出中医知识图谱。
7、作为本专利技术的进一步方案,所述文献实体集合具体为语句拆解结果、词汇单元提取结果、医学实体数据集,所述语音识别实体列表具体为口述语音采集结果、文字转换记录、语音实体集合,所述实体关系推导图具体为实体共现关系、前后修饰关系、实体间相互关系,所述中医知识图谱包括实体节点转化结果、关系边转换记录、同义实体属性融合。
8、作为本专利技术的进一步方案,所述文献实体集合的获取流程具体为:
9、s111:获取中医文献数据,对文献内容进行逐句拆解,分析句子结构,提取词汇单元,对每个词汇进行词性标注和句法角色分配,识别多种类型的词汇,包括名词、动词、形容词,建立句法结构分析结果;
10、s112:基于所述句法结构分析结果,分析相邻词汇间的搭配模式,计算句子中词汇组合的稳定性,采用公式:
11、;
12、计算词汇对的关联强度,并通过统计多个词汇间的共现频率,得到高频词汇组合集合;
13、其中,代表词汇组合的关联强度,代表词汇的共现频率,代表词汇在句法结构中的权重,代表参与计算的词汇数量,为词汇的索引;
14、s113:调用所述高频词汇组合集合,对照已有医学术语库,识别文本中的医学实体,包括病症、药物、治疗方法、病因,统计多类实体在文献中的分布情况,建立文献实体集合。
15、作为本专利技术的进一步方案,所述语音识别实体列表的获取流程具体为:
16、s211:基于所述文献实体集合,获取名老中医的口述语音,对音频信号进行预处理,包括采样率调整、噪声去除和语音增强,将处理后的音频信号划分为多个语段,采用短时傅里叶变换对语音进行时频转换,提取时域和频域特征,对语音进行去噪处理,得到语音分割结果;
17、s212:基于所述语音分割结果,将音频数据转换为文本符号序列,得到语音文本数据;
18、s213:调用所述语音文本数据,结合文献的多项实体,对比文本中相邻词语的搭配规律,计算候选词语与已知医学实体的相似度,采用公式:
19、;
20、计算每个词汇在语音文本中的匹配可信度,评估名老中医语音文本和文献中多个医学实体词汇的含义一致性,检测并提取语音文本中的医学术语,获取语音识别实体列表;
21、其中,代表文本词汇的匹配可信度,代表文本词汇的语境权重,代表该词汇与医学实体的语义匹配程度,代表该词汇的音素匹配概率,代表该词汇的上下文变形误差,代表文本中的有效词汇数量,为语音文本中词汇的索引。
22、作为本专利技术的进一步方案,所述实体关系推导图的获取流程具体为:
23、s311:调用所述语音识别实体列表,对比文本与语音来源的实体集合,通过计算相同实体在多种来源中的分布情况,分析多个实体在语音文本和文献文本中的出现频率,得到跨文本实体分布矩阵;
24、s312:基于所述跨文本实体分布矩阵,计算多种文本来源的实体共现频率,分析目标实体在多个文档中的共现次数,计算实体对的关联强度,采用公式:
25、;
26、计算实体在多个文档中的相关性,通过计算每个实体对的关联强度,使用行与列表示实体对中的两个实体,生成跨文档实体共现矩阵;
27、其中,代表实体关联强度,代表实体在语音文本中的标准化出现频率,代表实体在文献文本中的标准化出现频率,和分别为两本文档来自技高网...
【技术保护点】
1.用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述文献实体集合具体为语句拆解结果、词汇单元提取结果、医学实体数据集,所述语音识别实体列表具体为口述语音采集结果、文字转换记录、语音实体集合,所述实体关系推导图具体为实体共现关系、前后修饰关系、实体间相互关系,所述中医知识图谱包括实体节点转化结果、关系边转换记录、同义实体属性融合。
3.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述文献实体集合的获取流程具体为:
4.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述语音识别实体列表的获取流程具体为:
5.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述实体关系推导图的获取流程具体为:
6.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述中医知识图谱的获取流
7.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述方法还包括:
8.根据权利要求7所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述药物和病症关系集合的获取流程具体为:
...【技术特征摘要】
1.用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述文献实体集合具体为语句拆解结果、词汇单元提取结果、医学实体数据集,所述语音识别实体列表具体为口述语音采集结果、文字转换记录、语音实体集合,所述实体关系推导图具体为实体共现关系、前后修饰关系、实体间相互关系,所述中医知识图谱包括实体节点转化结果、关系边转换记录、同义实体属性融合。
3.根据权利要求1所述的用于名老中医经验活态传承的数字人知识图谱构建方法,其特征在于,所述文献实体集合的获取流程具体为:
4.根据权利要求1所...
【专利技术属性】
技术研发人员:王怡斐,孙斐斐,郭安良,宋慧慧,魏然,陈文静,王建,胡冬青,梁士兵,郑慧敏,
申请(专利权)人:山东中医药大学附属医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。