一种语义匹配的方法以及相关装置制造方法及图纸

技术编号：22974696 阅读：14 留言：0更新日期：2019-12-31 23:25

本申请公开了一种语义匹配的方法以及相关装置，通过融合了不同粒度的语义表达信息，提高句子语义匹配的准确性；具体包括：基于第一粒度分割待检测语句对，以获取第一序列；将第一序列转化为向量表示并输入第一深度神经网络，以得到初始向量；基于第二粒度分割第一序列，以获取第二序列；然后根据注意力机制对初始向量进行计算，以得到第一外部向量和第一内部向量；将初始向量、第一外部向量和第一内部向量输入第二深度神经网络进行学习，以得到待检测语句对的相似度，并得到语义匹配的结果。

A method of semantic matching and related devices

全部详细技术资料下载

【技术实现步骤摘要】
一种语义匹配的方法以及相关装置
本申请涉及计算机
，尤其涉及一种语义匹配的方法以及相关装置。
技术介绍
随着人工智能技术的发展，越来越多的智能设备出现在人们的生活中，特别是机器人相关的设备已经出现在了日常的服务工作中，在实际场景中客服机器人收到用户提问时，可以识别用户说出的语句，然后通过语义匹配在知识库的问答对中寻找最相似的问题来找到对应问题的答案。一般，对于语义匹配的过程是基于句子的单个粒度信息学习句子语义表达，并通过神经网络模型得到句子的语义匹配概率。但是，仅基于单个句子粒度学习句子语义，例如词粒度表示或者字粒度表示，往往需要大量的实验确定哪种粒度是更好的选择，而且在实际使用场景中，存在海量的语义数据需要处理，使得语义匹配的过程无法正常的运行，进而影响语义匹配的精确度。
技术实现思路
有鉴于此，本申请第一方面提供一种语义匹配的方法，可应用于静态数据库的系统或程序过程中，具体包括：基于第一粒度分割待检测语句对，以获取第一序列；将所述第一序列转化为向量表示并输入第一深度神经网络，以得到初始向量；基于第二粒度分割所述第一序列，以获取第二序列，所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小，所述第二序列中的元素与所述第一序列中的元素具有对应关系；根据第一预设算法对所述初始向量进行计算，以得到第一外部向量和第一内部向量，所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列，所述第一预设算法基于所述初始向量与所述第二序列中的元素向量...

【技术保护点】
1.一种语义匹配的方法，其特征在于，包括：/n基于第一粒度分割待检测语句对，以获取第一序列；/n将所述第一序列转化为向量表示并输入第一深度神经网络，以得到初始向量；/n基于第二粒度分割所述第一序列，以获取第二序列，所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小，所述第二序列中的元素与所述第一序列中的元素具有对应关系；/n根据第一预设算法对所述初始向量进行计算，以得到第一外部向量和第一内部向量，所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列，所述第一预设算法基于所述初始向量与所述第二序列中的元素向量的相似性设定，所述第一内部向量基于所述分隔点计算所得，所述第一外部向量基于与所述分隔点相邻的元素计算所得；/n将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习，以得到所述待检测语句对的相似度，所述待检测语句对的相似度用于指示语义匹配的结果。/n

【技术特征摘要】
1.一种语义匹配的方法，其特征在于，包括：
基于第一粒度分割待检测语句对，以获取第一序列；
将所述第一序列转化为向量表示并输入第一深度神经网络，以得到初始向量；
基于第二粒度分割所述第一序列，以获取第二序列，所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小，所述第二序列中的元素与所述第一序列中的元素具有对应关系；
根据第一预设算法对所述初始向量进行计算，以得到第一外部向量和第一内部向量，所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列，所述第一预设算法基于所述初始向量与所述第二序列中的元素向量的相似性设定，所述第一内部向量基于所述分隔点计算所得，所述第一外部向量基于与所述分隔点相邻的元素计算所得；
将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习，以得到所述待检测语句对的相似度，所述待检测语句对的相似度用于指示语义匹配的结果。

2.根据权利要求1所述的方法，其特征在于，所述根据第一预设算法对所述初始向量进行计算，以得到第一外部向量和第一内部向量，包括：
根据所述初始向量与所述第二序列中的元素向量的相似性比值分别确定所述第一外部向量的权重信息和所述第一内部向量的权重信息；
将所述第一外部向量的权重信息和所述第一内部向量的权重信息输入所述第一预设算法，以分别计算得到所述第一外部向量和所述第一内部向量。

3.根据权利要求1所述的方法，其特征在于，所述基于第二粒度分割所述第一序列，以获取第二序列，包括：
确定所述第一序列中的多个元素；
确定所述第二粒度指示的划分单元大小；
根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割，以获取第二序列。

4.根据权利要求3所述的方法，其特征在于，所述确定所述第一序列中的多个元素，包括：
获取预设的特征元素集合；
根据所述特征元素集合在所述第一序列中进行遍历，以标记出特征元素；
所述根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割，以获取第二序列，包括：
根据所述第二粒度指示的划分单元大小对所述特征元素进行分割，以获取第二序列。

5.根据根据权利要求3所述的方法，其特征在于，所述根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割，以获取第二序列，包括：
确定所述第一序列中用于指示虚词的元素位置；
根据所述第二粒度指示的划分单元大小对所述第一序列的非虚词部分进行分割，以获取第二序列，所述非虚词部分为除去所述指示虚词的元素的部分。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习，以得到所述待检测语句对的相似度，包括：
利用连接函数组合所述初始向量、所述第一外部向量...

【专利技术属性】
技术研发人员：陈华栋，徐广庆，陈健，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人