一种语义分析识别方法、系统、介质和设备技术方案

技术编号：22467648 阅读：14 留言：0更新日期：2019-11-06 11:28

本发明专利技术提出一种语义分析识别方法、系统、介质和设备，包括：根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；根据所述语料库和所述逻辑库，训练词义识别模型，获取语料库词义特征向量；根据所述语料库和所述逻辑库，训练句义识别模型，获取语料库句义特征向量；根据所述语料库的词义特征向量、句义特征向量和所述逻辑库，训练融合模型，获取语料特征和所述语料库文本的对应关系；获取待解析文本的词义特征向量和句义特征向量；根据所述待解析文本的词义特征向量、句义特征向量和所述逻辑库，结合所述融合模型，获取语义识别结果；本发明专利技术可以有效提高自然语言识别的准确性。

A method, system, medium and equipment of semantic analysis and recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种语义分析识别方法、系统、介质和设备
本专利技术涉及自然语言识别领域，尤其涉及一种语义分析识别方法、系统、介质和设备。
技术介绍
自然语言处理技术主要分为语法分析和统计两大类。目前，国内外的大量自然语言研究都是集中于基于统计和基于深度学习技术的自然语言处理技术。在目前互联网存在各行业无标注语料大数据的情况下，利用深度学习技术，构建无监督学习，建立其语义模型、行业知识库显得尤为重要，也是将来的发展趋势。深度学习技术的兴起为统计类方法提供了更好的实现途径，大大提高了神经网络的学习预测能力。然而，在某些特定的专业领域，如法律咨询等，问答语料标注数据较少，难以直接应用于需要大量样本数据的深度神经网络。另外，现有的自然语言处理方式大多都是采用关键词提取和统计的方法，这种语义理解方式比较局限，因为，除了字面上的语义外，对语义的理解还依赖于上下文和日常知识。因此，目前亟需一种能够更有效更精确的语义理解方法。
技术实现思路
鉴于以上现有技术存在的问题，本专利技术提出一种语义分析识别方法、系统、介质和设备，主要解决自然语言的理解和识别准确率不高的问题。为了实现上述目的及其他目的，本专利技术采用的技术方案如下。一种语义分析识别方法，包括：根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；创建词义识别模型，根据所述语料库和所述逻辑库，训练所述词义识别模型，建立词语与语料库中文本上下文的对应关系，获取语料库词义特征向量；创建句义识别模型，根据所述语料库和所述逻辑库，训练所述句义识别模型，建立句子与语料库中文本上下文的对应关系，获取语料库句义特征向量；创建融合模型，根据所述...

【技术保护点】
1.一种语义分析识别方法，其特征在于，包括：根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；创建词义识别模型，根据所述语料库和所述逻辑库，训练所述词义识别模型，建立词语与语料库中文本上下文的对应关系，获取语料库词义特征向量；创建句义识别模型，根据所述语料库和所述逻辑库，训练所述句义识别模型，建立句子与语料库中文本上下文的对应关系，获取语料库句义特征向量；创建融合模型，根据所述语料库的词义特征向量、句义特征向量和所述逻辑库，训练所述融合模型，获取语料特征和所述语料库文本的对应关系；将待解析文本分别输入经过训练的词义识别模型和句义识别模型，获取待解析文本的词义特征向量和句义特征向量；将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束，输入所述融合模型，获取语义识别结果。

【技术特征摘要】
1.一种语义分析识别方法，其特征在于，包括：根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；创建词义识别模型，根据所述语料库和所述逻辑库，训练所述词义识别模型，建立词语与语料库中文本上下文的对应关系，获取语料库词义特征向量；创建句义识别模型，根据所述语料库和所述逻辑库，训练所述句义识别模型，建立句子与语料库中文本上下文的对应关系，获取语料库句义特征向量；创建融合模型，根据所述语料库的词义特征向量、句义特征向量和所述逻辑库，训练所述融合模型，获取语料特征和所述语料库文本的对应关系；将待解析文本分别输入经过训练的词义识别模型和句义识别模型，获取待解析文本的词义特征向量和句义特征向量；将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束，输入所述融合模型，获取语义识别结果。2.根据权利要求1所述的语义分析识别方法，其特征在于，所述获取语料库词义特征向量包括：对所述语料库中文本进行分词处理；对分词处理结果进行编码，获取词编码数据；创建神经网络，将所述词编码数据和对应的逻辑约束输入所述神经网络，对所述神经网络进行训练，获取词义识别模型；根据所述词义识别模型的识别结果，将关联词语整合后转换成语料库词义特征向量。3.根据权利要求1所述的语义分析识别方法，其特征在于，所述获取语料库句义特征向量包括：对所述语料库中文本进行分句处理；对分句处理结果进行编码，获取句编码数据；创建镜像深度神经网络，将所述句编码数据和对应的逻辑约束输入所述镜像深度神经网络，对所述镜像深度神经网络进行训练，获取句义识别模型；根据所述句义识别模型的识别结果，将关联句子整合后转换成语料库句义特征向量。4.根据权利要求1所述的语义分析识别方法，其特征在于，所述训练融合模型包括：根据所述逻辑库、词义特征向量和句义特征向量，获取知识单元；对所述知识单元进行编码，获取知识编码数据；创建深度新联神经网络，将所述知识编码数据输入深度信念神经网络进行模型训练，获取融合模型。5.根据权利要求4所述的语义分析识别方法，其特征在于，所述获取知识单元包括：根据所述逻辑库创建词语和句子对应的约束条件；根据所述约束条件，获取逻辑库中与所述约束条件关联的逻辑约束，创建知...

【专利技术属性】
技术研发人员：彭德光，孙健，
申请(专利权)人：重庆兆光科技股份有限公司，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人