基于复合神经网络的语义关系推断系统和方法技术方案

技术编号：24411078 阅读：74 留言：0更新日期：2020-06-06 09:14

本发明专利技术实施例提供一种基于复合神经网络的语义关系推断系统和方法。所述系统包括特征提取单元、训练单元以及决策单元，所述训练单元包括双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型，特征提取单元，用于提取输入文本的词向量输出至所述训练单元；训练单元，用于接收所述词向量，将需要匹配的两个文本的词向量分别进行双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型的训练，将各模型输出的结果向量输出至决策单元；决策单元，用于接收训练单元输入的结果向量，通过梯度增强决策树进行整合后输出需要匹配的两个文本的语义关系。本发明专利技术实施例能够提高同义词语义关系检测的精准度。

Semantic relation inference system and method based on Compound Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
基于复合神经网络的语义关系推断系统和方法
本专利技术实施例涉及自然语言处理
，尤其涉及一种基于复合神经网络的语义关系推断系统和方法。
技术介绍
随着深度学习的兴起，基于神经网络的语义分析成为研究热点，同义词、近义词语义关系的检测成为推断短文本上下文关系的关键。目前，提高语义关系推断的方法精准性的方式主要是通过大量的人工特征提取。通常是基于业务情况、数据状况进行的针对性提取。例如，对常见的业务同义词进行统一化等。但是该方法的精准性提升通常很难迁移到另外的数据集上。同时，人工特征提取将占用系统构建的大部分时间。
技术实现思路
本专利技术实施例提供一种基于复合神经网络的语义关系推断系统和方法，用以解决现有技术中语义关系推断精准度低的问题。第一方面，本专利技术实施例提供一种基于复合神经网络的语义关系推断系统，所述系统包括特征提取单元、训练单元以及决策单元，所述训练单元包括双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型，其中：所述特征提取单元，用于提取输入文本的词向量输出至所述训练单元；所述训练单元，用于接收所述词向量，将需要匹配的两个文本的词向量分别进行双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型的训练，将各模型输出的结果向量输出至所述决策单元；所述决策单元，用于接收所述训练单元输入的结果向量，通过梯度增强决策树进行整合后输出需要匹配的两个文本的语义关系。第二方面，本专利技术实施例提供一种复合神经网络的语义关系推断方法，所

【技术保护点】
1.一种基于复合神经网络的语义关系推断系统，其特征在于，所述系统包括特征提取单元、训练单元以及决策单元，所述训练单元包括双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型，其中：/n所述特征提取单元，用于提取输入文本的词向量输出至所述训练单元；/n所述训练单元，用于接收所述词向量，将需要匹配的两个文本的词向量分别进行双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型的训练，将各模型输出的结果向量输出至所述决策单元；/n所述决策单元，用于接收所述训练单元输入的结果向量，通过梯度增强决策树进行整合后输出需要匹配的两个文本的语义关系。/n

【技术特征摘要】
1.一种基于复合神经网络的语义关系推断系统，其特征在于，所述系统包括特征提取单元、训练单元以及决策单元，所述训练单元包括双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型，其中：
所述特征提取单元，用于提取输入文本的词向量输出至所述训练单元；
所述训练单元，用于接收所述词向量，将需要匹配的两个文本的词向量分别进行双生长短期记忆神经网络模型、分解焦距模型以及增强序列推断模型的训练，将各模型输出的结果向量输出至所述决策单元；
所述决策单元，用于接收所述训练单元输入的结果向量，通过梯度增强决策树进行整合后输出需要匹配的两个文本的语义关系。

2.根据权利要求1所述的系统，其特征在于，所述双生长短期记忆神经网络模型包括：
第一输入模块，用于将需要匹配的两个文本的词向量分别输入到两个长短期记忆神经网络，得到两个文本的最终隐藏状态；
第一训练模块，将两个文本的最终隐藏状态的归一化后的差值作为预测标签进行训练；
第一输出模块，用于将训练得的两个文本的最终隐藏状态进行向量拼接，输出至所述决策单元。

3.根据权利要求1所述的系统，其特征在于，所述分解焦距模型包括：
第二输入模块，用于将需要匹配的两个文本的词向量输入到一个分解聚焦矩阵，得到两个词向量位置的对位词向量；
第二训练单元，用于将对位词向量和相应位置的原词向量的比较结果输入到前馈神经网络进行训练；
第二输出单元，用于将训练得的两个文本的位置比较结果池化后的向量进行拼接，输出至所述决策单元。

4.根据权利要求1所述的系统，其特征在于，所述增强序列推断模型包括：
第三输入模块，用于将需要匹配的两个文本的词向量输入到一个双生长短期记忆神经网络，得到每一步两个文本的隐藏状态；
第四输入模块，用于将双生长短期记忆神经网络每一步的隐藏状态作为对应文本的位置编码，输入到一个分解聚焦矩阵，得到两个文本的对位局域编码；
第五输入模块，用于将两个文本的对位局域编码输入到一个长短期记忆神经网络，得到两个文本的隐藏状态；
第三输出单元，用于将两个文本的隐藏状态池化后的向量进行拼接，输出至所述决策单元。

<...

【专利技术属性】
技术研发人员：何广，朱琦，林鹏飞，袁源，覃玲华，毛仕文，陈开添，
申请(专利权)人：中国移动通信集团广东有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人