一种语义分析识别方法、系统、介质和设备技术方案

技术编号:22467648 阅读:14 留言:0更新日期:2019-11-06 11:28
本发明专利技术提出一种语义分析识别方法、系统、介质和设备,包括:根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;根据所述语料库和所述逻辑库,训练词义识别模型,获取语料库词义特征向量;根据所述语料库和所述逻辑库,训练句义识别模型,获取语料库句义特征向量;根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练融合模型,获取语料特征和所述语料库文本的对应关系;获取待解析文本的词义特征向量和句义特征向量;根据所述待解析文本的词义特征向量、句义特征向量和所述逻辑库,结合所述融合模型,获取语义识别结果;本发明专利技术可以有效提高自然语言识别的准确性。

A method, system, medium and equipment of semantic analysis and recognition

【技术实现步骤摘要】
一种语义分析识别方法、系统、介质和设备
本专利技术涉及自然语言识别领域,尤其涉及一种语义分析识别方法、系统、介质和设备。
技术介绍
自然语言处理技术主要分为语法分析和统计两大类。目前,国内外的大量自然语言研究都是集中于基于统计和基于深度学习技术的自然语言处理技术。在目前互联网存在各行业无标注语料大数据的情况下,利用深度学习技术,构建无监督学习,建立其语义模型、行业知识库显得尤为重要,也是将来的发展趋势。深度学习技术的兴起为统计类方法提供了更好的实现途径,大大提高了神经网络的学习预测能力。然而,在某些特定的专业领域,如法律咨询等,问答语料标注数据较少,难以直接应用于需要大量样本数据的深度神经网络。另外,现有的自然语言处理方式大多都是采用关键词提取和统计的方法,这种语义理解方式比较局限,因为,除了字面上的语义外,对语义的理解还依赖于上下文和日常知识。因此,目前亟需一种能够更有效更精确的语义理解方法。
技术实现思路
鉴于以上现有技术存在的问题,本专利技术提出一种语义分析识别方法、系统、介质和设备,主要解决自然语言的理解和识别准确率不高的问题。为了实现上述目的及其他目的,本专利技术采用的技术方案如下。一种语义分析识别方法,包括:根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;创建词义识别模型,根据所述语料库和所述逻辑库,训练所述词义识别模型,建立词语与语料库中文本上下文的对应关系,获取语料库词义特征向量;创建句义识别模型,根据所述语料库和所述逻辑库,训练所述句义识别模型,建立句子与语料库中文本上下文的对应关系,获取语料库句义特征向量;创建融合模型,根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练所述融合模型,获取语料特征和所述语料库文本的对应关系;将待解析文本分别输入经过训练的词义识别模型和句义识别模型,获取待解析文本的词义特征向量和句义特征向量;将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束,输入所述融合模型,获取语义识别结果。可选地,所述获取语料库词义特征向量包括:对所述语料库中文本进行分词处理;对分词处理结果进行编码,获取词编码数据;创建神经网络,将所述词编码数据和对应的逻辑约束输入所述神经网络,对所述神经网络进行训练,获取词义识别模型;根据所述词义识别模型的识别结果,将关联词语整合后转换成语料库词义特征向量。可选地,所述获取语料库句义特征向量包括:对所述语料库中文本进行分句处理;对分句处理结果进行编码,获取句编码数据;创建镜像深度神经网络,将所述句编码数据和对应的逻辑约束输入所述镜像深度神经网络,对所述镜像深度神经网络进行训练,获取句义识别模型;根据所述句义识别模型的识别结果,将关联句子整合后转换成语料库句义特征向量。可选地,所述训练融合模型包括:根据所述逻辑库、词义特征向量和句义特征向量,获取知识单元;对所述知识单元进行编码,获取知识编码数据;创建深度新联神经网络,将所述知识编码数据输入深度信念神经网络进行模型训练,获取融合模型。可选地,所述获取知识单元包括:根据所述逻辑库创建词语和句子对应的约束条件;根据所述约束条件,获取逻辑库中与所述约束条件关联的逻辑约束,创建知识图谱;根据所述知识图谱,提取所述语料库词义特征向量和句义特征向量中的对应的词语和句子,获取知识单元。可选地,所述获取语义识别结果包括:计算所述待解析文本词义特征向量与所述语料库词义特征向量的相似度,获取词义相似度;计算所述待解析文本句义特征向量与所述语料库句义特征向量的相似度,获取句义相似度;将所述词义相似度和所述句义相似度与设定的相似度阈值进行比较,获取相似度判断结果;根据所述相似度判断结果和所述逻辑库,获取待解析文本的知识单元。将所述待解析文本的知识单元输入所述融合模块,获取与所述待解析文本匹配度最高的语料库文本。可选地,所述获取待解析文本的词义特征向量和句义特征向量之前,对所述待解析文本进行预处理,包括:对待解析文本进行分词和分句处理,获取处理结果;根据所述逻辑库,对所述处理结果进行标注。一种语义分析识别系统,其特征在于,包括:语料库;逻辑库创建模块;用于根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;模型训练模块;创建词义识别模型,根据所述语料库和所述逻辑库,训练所述词义识别模型,建立词语与语料库中文本上下文的对应关系,获取语料库词义特征向量;创建句义识别模型,根据所述语料库和所述逻辑库,训练所述句义识别模型,建立句子与语料库中文本上下文的对应关系,获取语料库句义特征向量;创建融合模型,根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练所述融合模型,获取语料特征和所述语料库文本的对应关系;识别模块,将待解析文本分别输入经过训练的词义识别模型和句义识别模型,获取待解析文本的词义特征向量和句义特征向量;将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束,输入所述融合模型,获取语义识别结果。一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现所述的语义分析识别方法。一种设备,其特征在于,包括处理器和存储器;其中,所述存储器用于存储计算机程序;所述处理器用于加载并执行所述计算机程序,使得所述设备执行所述的语义分析识别方法。如上所述,本专利技术一种语义识别方法、系统、介质和设备,具有以下有益效果。通过引入逻辑库,训练识别模型,可以使识别信息收敛性更好,提高识别效率;通过词义和句义相结合,可以提高语义识别的全面性和准确性。附图说明图1为本专利技术一实施例中的语义分析识别方法的流程图。图2为本专利技术一实施例中的语义分析识别系统的模块图。图3为本专利技术一实施例中的设备的结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。自然语言识别,是人工识别领域的一个重要研究课题,是研究人与计算机间用自然语言进行有效通信的重要理论基础。然而,由于自然语言文本和对话在各个层次上广泛存在的各式各样的歧义性和多义性,计算机理解自然语言变得异常困难。对自然语言的处理方法将直接关系到自然语言的识别结果。而传统的方法大多依赖于统计学方法,应用于大数据量的文本时,不仅效率低,准确性也不高。因此,本方案提出了一种语言分析识别方法,基于知识进行深层次的逻辑推理,通过只是在文本中的深层逻辑关系,获取更准确的识别信息,提高自然语言识别的准确率。请参阅图1,本专利技术提供一种语义分析识别方法,包括步骤S01-S06。在步骤S01中,根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;在一实施例中,可针对某一个特定的
专门建立一个语料库,如针对法律领域,本文档来自技高网
...

【技术保护点】
1.一种语义分析识别方法,其特征在于,包括:根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;创建词义识别模型,根据所述语料库和所述逻辑库,训练所述词义识别模型,建立词语与语料库中文本上下文的对应关系,获取语料库词义特征向量;创建句义识别模型,根据所述语料库和所述逻辑库,训练所述句义识别模型,建立句子与语料库中文本上下文的对应关系,获取语料库句义特征向量;创建融合模型,根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练所述融合模型,获取语料特征和所述语料库文本的对应关系;将待解析文本分别输入经过训练的词义识别模型和句义识别模型,获取待解析文本的词义特征向量和句义特征向量;将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束,输入所述融合模型,获取语义识别结果。

【技术特征摘要】
1.一种语义分析识别方法,其特征在于,包括:根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;创建词义识别模型,根据所述语料库和所述逻辑库,训练所述词义识别模型,建立词语与语料库中文本上下文的对应关系,获取语料库词义特征向量;创建句义识别模型,根据所述语料库和所述逻辑库,训练所述句义识别模型,建立句子与语料库中文本上下文的对应关系,获取语料库句义特征向量;创建融合模型,根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练所述融合模型,获取语料特征和所述语料库文本的对应关系;将待解析文本分别输入经过训练的词义识别模型和句义识别模型,获取待解析文本的词义特征向量和句义特征向量;将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束,输入所述融合模型,获取语义识别结果。2.根据权利要求1所述的语义分析识别方法,其特征在于,所述获取语料库词义特征向量包括:对所述语料库中文本进行分词处理;对分词处理结果进行编码,获取词编码数据;创建神经网络,将所述词编码数据和对应的逻辑约束输入所述神经网络,对所述神经网络进行训练,获取词义识别模型;根据所述词义识别模型的识别结果,将关联词语整合后转换成语料库词义特征向量。3.根据权利要求1所述的语义分析识别方法,其特征在于,所述获取语料库句义特征向量包括:对所述语料库中文本进行分句处理;对分句处理结果进行编码,获取句编码数据;创建镜像深度神经网络,将所述句编码数据和对应的逻辑约束输入所述镜像深度神经网络,对所述镜像深度神经网络进行训练,获取句义识别模型;根据所述句义识别模型的识别结果,将关联句子整合后转换成语料库句义特征向量。4.根据权利要求1所述的语义分析识别方法,其特征在于,所述训练融合模型包括:根据所述逻辑库、词义特征向量和句义特征向量,获取知识单元;对所述知识单元进行编码,获取知识编码数据;创建深度新联神经网络,将所述知识编码数据输入深度信念神经网络进行模型训练,获取融合模型。5.根据权利要求4所述的语义分析识别方法,其特征在于,所述获取知识单元包括:根据所述逻辑库创建词语和句子对应的约束条件;根据所述约束条件,获取逻辑库中与所述约束条件关联的逻辑约束,创建知...

【专利技术属性】
技术研发人员:彭德光孙健
申请(专利权)人:重庆兆光科技股份有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1