一种语义匹配的方法以及相关装置制造方法及图纸

技术编号:22974696 阅读:14 留言:0更新日期:2019-12-31 23:25
本申请公开了一种语义匹配的方法以及相关装置,通过融合了不同粒度的语义表达信息,提高句子语义匹配的准确性;具体包括:基于第一粒度分割待检测语句对,以获取第一序列;将第一序列转化为向量表示并输入第一深度神经网络,以得到初始向量;基于第二粒度分割第一序列,以获取第二序列;然后根据注意力机制对初始向量进行计算,以得到第一外部向量和第一内部向量;将初始向量、第一外部向量和第一内部向量输入第二深度神经网络进行学习,以得到待检测语句对的相似度,并得到语义匹配的结果。

A method of semantic matching and related devices

【技术实现步骤摘要】
一种语义匹配的方法以及相关装置
本申请涉及计算机
,尤其涉及一种语义匹配的方法以及相关装置。
技术介绍
随着人工智能技术的发展,越来越多的智能设备出现在人们的生活中,特别是机器人相关的设备已经出现在了日常的服务工作中,在实际场景中客服机器人收到用户提问时,可以识别用户说出的语句,然后通过语义匹配在知识库的问答对中寻找最相似的问题来找到对应问题的答案。一般,对于语义匹配的过程是基于句子的单个粒度信息学习句子语义表达,并通过神经网络模型得到句子的语义匹配概率。但是,仅基于单个句子粒度学习句子语义,例如词粒度表示或者字粒度表示,往往需要大量的实验确定哪种粒度是更好的选择,而且在实际使用场景中,存在海量的语义数据需要处理,使得语义匹配的过程无法正常的运行,进而影响语义匹配的精确度。
技术实现思路
有鉴于此,本申请第一方面提供一种语义匹配的方法,可应用于静态数据库的系统或程序过程中,具体包括:基于第一粒度分割待检测语句对,以获取第一序列;将所述第一序列转化为向量表示并输入第一深度神经网络,以得到初始向量;基于第二粒度分割所述第一序列,以获取第二序列,所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小,所述第二序列中的元素与所述第一序列中的元素具有对应关系;根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量,所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列,所述第一预设算法基于所述初始向量与所述第二序列中的元素向量的相似性设定,所述第一内部向量基于所述分隔点计算所得,所述第一外部向量基于与所述分隔点相邻的元素计算所得;将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,所述待检测语句对的相似度用于指示语义匹配的结果。优选的,在本申请一些可能的实现方式中,所述根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量,包括:根据所述初始向量与所述第二序列中的元素向量的相似性比值分别确定所述第一外部向量的权重信息和所述第一内部向量的权重信息;将所述第一外部向量的权重信息和所述第一内部向量的权重信息输入所述第一预设算法,以分别计算得到所述第一外部向量和所述第一内部向量。优选的,在本申请一些可能的实现方式中,所述基于第二粒度分割所述第一序列,以获取第二序列,包括:确定所述第一序列中的多个元素;确定所述第二粒度指示的划分单元大小;根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割,以获取第二序列。优选的,在本申请一些可能的实现方式中,所述确定所述第一序列中的多个元素,包括:获取预设的特征元素集合;根据所述特征元素集合在所述第一序列中进行遍历,以标记出特征元素;所述根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割,以获取第二序列,包括:根据所述第二粒度指示的划分单元大小对所述特征元素进行分割,以获取第二序列。优选的,在本申请一些可能的实现方式中,根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割,以获取第二序列,包括:确定所述第一序列中用于指示虚词的元素位置;根据所述第二粒度指示的划分单元大小对所述第一序列的非虚词部分进行分割,以获取第二序列,所述非虚词部分为除去所述指示虚词的元素的部分。优选的,在本申请一些可能的实现方式中,所述将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,包括:利用连接函数组合所述初始向量、所述第一外部向量和所述第一内部向量,以得到所述待检测语句对的多粒度向量表示;将所述多粒度向量表示输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度。优选的,在本申请一些可能的实现方式中,所述根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量之后,所述方法还包括:根据预设规则获取第三粒度,所述预设规则基于语义的划分规则设定;基于所述第三粒度分割所述第一序列,以获取第三序列,所述第三粒度的划分单元大小小于所述第一粒度的划分单元大小;采用所述第三序列中的元素作为分隔点切割所述第一序列,以得到第二外部向量和第二内部向量;根据第二预设算法分别计算所述第二外部向量和所述第二内部向量,所述第二预设算法基于所述初始向量与所述第三序列中的元素的相似性设定;所述利用连接函数组合所述初始向量、所述第一外部向量和所述第一内部向量,以得到所述待检测语句对的多粒度向量表示,包括:利用连接函数组合所述初始向量、所述第一外部向量、所述第一内部向量、所述第二外部向量和所述第二内部向量,以得到所述待检测语句对的多粒度向量表示;所述将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,包括:所述将所述初始向量、所述第二外部向量、所述第二内部向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度。优选的,在本申请一些可能的实现方式中,所述语义匹配的方法应用于终端设备,所述终端设备为区块链节点中的区块节点设备。本申请第二方面提供一种语义匹配的装置,包括:分割单元,用于基于第一粒度分割待检测语句对,以获取第一序列;匹配单元,用于将所述第一序列转化为向量表示并输入第一深度神经网络,以得到初始向量;所述分割单元,还用于基于第二粒度分割所述第一序列,以获取第二序列,所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小,所述第二序列中的元素与所述第一序列中的元素具有对应关系;计算单元,用于根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量,所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列,所述第一预设算法基于所述初始向量与所述第二序列中的元素向量的相似性设定,所述第一内部向量基于所述分隔点计算所得,所述第一外部向量基于与所述分隔点相邻的元素计算所得;所述匹配单元,还用于将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,所述待检测语句对的相似度用于指示语义匹配的结果。优选的,在本申请一些可能的实现方式中,所述计算单元,具体用于根据所述初始向量与所述第二序列中的元素向量的相似性比值分别确定所述第一外部向量的权重信息和所述第一内部向量的权重信息;所述计算单元,具体用于将所述第一外部向量的权重信息和所述第一内部向量的权重信息输入所述第一预设算法,以分别计算得到所述第一外部向量和所述第一内部向量。优选的,在本申请一些可能的实现方式中,所述分割单元,具体用于确定所述第一序列中的多个元素;所本文档来自技高网...

【技术保护点】
1.一种语义匹配的方法,其特征在于,包括:/n基于第一粒度分割待检测语句对,以获取第一序列;/n将所述第一序列转化为向量表示并输入第一深度神经网络,以得到初始向量;/n基于第二粒度分割所述第一序列,以获取第二序列,所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小,所述第二序列中的元素与所述第一序列中的元素具有对应关系;/n根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量,所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列,所述第一预设算法基于所述初始向量与所述第二序列中的元素向量的相似性设定,所述第一内部向量基于所述分隔点计算所得,所述第一外部向量基于与所述分隔点相邻的元素计算所得;/n将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,所述待检测语句对的相似度用于指示语义匹配的结果。/n

【技术特征摘要】
1.一种语义匹配的方法,其特征在于,包括:
基于第一粒度分割待检测语句对,以获取第一序列;
将所述第一序列转化为向量表示并输入第一深度神经网络,以得到初始向量;
基于第二粒度分割所述第一序列,以获取第二序列,所述第二粒度的划分单元大小小于所述第一粒度的划分单元大小,所述第二序列中的元素与所述第一序列中的元素具有对应关系;
根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量,所述第一预设算法包括采用所述第二序列中的元素作为分隔点切割所述第一序列,所述第一预设算法基于所述初始向量与所述第二序列中的元素向量的相似性设定,所述第一内部向量基于所述分隔点计算所得,所述第一外部向量基于与所述分隔点相邻的元素计算所得;
将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,所述待检测语句对的相似度用于指示语义匹配的结果。


2.根据权利要求1所述的方法,其特征在于,所述根据第一预设算法对所述初始向量进行计算,以得到第一外部向量和第一内部向量,包括:
根据所述初始向量与所述第二序列中的元素向量的相似性比值分别确定所述第一外部向量的权重信息和所述第一内部向量的权重信息;
将所述第一外部向量的权重信息和所述第一内部向量的权重信息输入所述第一预设算法,以分别计算得到所述第一外部向量和所述第一内部向量。


3.根据权利要求1所述的方法,其特征在于,所述基于第二粒度分割所述第一序列,以获取第二序列,包括:
确定所述第一序列中的多个元素;
确定所述第二粒度指示的划分单元大小;
根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割,以获取第二序列。


4.根据权利要求3所述的方法,其特征在于,所述确定所述第一序列中的多个元素,包括:
获取预设的特征元素集合;
根据所述特征元素集合在所述第一序列中进行遍历,以标记出特征元素;
所述根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割,以获取第二序列,包括:
根据所述第二粒度指示的划分单元大小对所述特征元素进行分割,以获取第二序列。


5.根据根据权利要求3所述的方法,其特征在于,所述根据所述第二粒度指示的划分单元大小对所述第一序列的多个元素进行分割,以获取第二序列,包括:
确定所述第一序列中用于指示虚词的元素位置;
根据所述第二粒度指示的划分单元大小对所述第一序列的非虚词部分进行分割,以获取第二序列,所述非虚词部分为除去所述指示虚词的元素的部分。


6.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述初始向量、所述第一外部向量和所述第一内部向量输入第二深度神经网络进行学习,以得到所述待检测语句对的相似度,包括:
利用连接函数组合所述初始向量、所述第一外部向量...

【专利技术属性】
技术研发人员:陈华栋徐广庆陈健
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1