语义召回方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:25915037 阅读:15 留言:0更新日期:2020-10-13 10:33
本申请实施例属于人工智能领域,涉及一种语义召回方法,包括在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;获取存储的候选句向量;基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。本申请还提供一种语义召回装置、计算机设备及存储介质。本申请实现了在不改变原有模型的精度下,将传统模型的表征层和输出层拆分开分别作为句向量生成器和拼接器,提高了模型处理的并发量,提高了模型在处理语料资料时的处理效率及问答匹配的准确率。

【技术实现步骤摘要】
语义召回方法、装置、计算机设备及存储介质
本申请涉及人工智能
,尤其涉及一种语义召回方法、装置、计算机设备及存储介质。
技术介绍
目前,语义召回模型被广泛地应用于AI问答系统中,随着科技的发展,越来越多的地方以AI问答系统来代替人工问答,以提高认为处理效率。其中,语义召回模型主要以传统深度学习模型为主,如CNN、LSTM、ESTM模型等。然而,随着信息时代的高速发展,模型需要处理的语料数据也越来越庞大,精度也越来越高,覆盖面也越来越广。当前的语义召回模型在处理大量语料数据时,并不能高效处理大量的语料数据,其训练速度慢、收敛时间长并且内存占用大,由此导致语义召回模型在处理语料数据时效率低下的技术问题。
技术实现思路
本申请实施例的目的在于提出一种语义召回方法、装置、计算机设备及存储介质,旨在解决语义召回模型处理语料数据效率低下的技术问题。为了解决上述技术问题,本申请实施例提供一种语义召回方法,采用了如下所述的技术方案:一种语义召回方法,包括以下步骤:在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;获取存储的候选句向量;基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。进一步的,所述基于句向量生成器获取所述线上查询数据对应的线上句向量的步骤包括:基于句向量生成器,获取所述线上查询数据的字向量;对所述字向量进行多层卷积处理,得到所述线上查询数据的线上句向量。进一步的,所述基于句向量生成器,获取所述线上查询数据的字向量的步骤包括:基于句向量生成器的标记解析层对所述线上查询数据中的每个字进行ID化处理,得到所述线上查询数据中的每个字对应的ID;基于所述句向量生成器的嵌入层对所述ID进行特征编码,得到所述线上查询数据中每个字对应的字向量。进一步的,所述对所述字向量进行多层卷积处理,得到所述线上查询数据的线上句向量的步骤包括:基于卷积神经网络对所述字向量进行多层卷积处理,得到所述线上查询数据对应的语义特征;将每次得到的所述语义特征拼接在一起,得到所述线上查询数据的线上句向量。进一步的,所述获取存储的候选句向量的步骤包括:获取问题库中存储的候选问题;基于所述句向量生成器对所述候选问题进行离线计算,得到所述候选问题对应的候选句向量。进一步的,所述基于所述句向量生成器对所述候选问题进行离线计算,得到所述候选问题对应的候选句向量的步骤之后,还包括:获取每个所述候选句向量对应的唯一标识信息;根据所述标识信息,将所述候选句向量以字典的形式,与所述候选问题关联存储至数据库中。进一步的,所述基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度的步骤包括:计算所述线上句向量和所述候选句向量在乘法、减法和最大值三个衡量维度上的差异特征向量;将所述三个衡量维度上的差异特征向量拼接在一起,得到最终的差异特征向量;对所述最终的差异特征向量进行正则化处理,得到处理结果;对所述处理结果进行函数处理,得到所述线上句向量和所述候选句向量之间的相似度。为了解决上述技术问题,本申请实施例还提供一种语义召回装置,采用了如下所述的技术方案:第一获取模块,用于在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;第二获取模块,用于获取存储的候选句向量;拼接模块,用于基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;排序模块,用于根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语义召回方法的步骤。为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语义召回方法的步骤。上述语义召回方法、装置、计算机设备及存储介质,通过在接收到线上查询数据时,该线上查询数据即为输入的句子,基于句向量生成器获取所述线上查询数据对应的线上句向量,该线上句向量即为该线上查询数据对应的向量形式数据;获取存储的候选句向量,其中,该候选句向量为预先存储于数据库中候选问题对应的句向量;基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;根据相似度即可对候选句向量进行筛选,从而筛选出与该线上句向量最为匹配的候选句向量。具体地,根据所述相似度对候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。由此,则解决了语义召回模型处理语料数据效率低下技术问题。附图说明为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请可以应用于其中的示例性系统架构图;图2为语义召回方法的一个实施例的流程图;图3为一个句向量生成器的示意图;图4为一个句向量拼接器的示意图;图5是根据本申请的语义召回装置的一个实施例的结构示意图;图6是根据本申请的计算机设备的一个实施例的结构示意图。附图标记:语义召回装置600,第一获取模块610,第二获取模块620,拼接模块630,排序模块640。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅本文档来自技高网
...

【技术保护点】
1.一种语义召回方法,其特征在于,包括下述步骤:/n在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;/n获取存储的候选句向量;/n基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;/n根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。/n

【技术特征摘要】
1.一种语义召回方法,其特征在于,包括下述步骤:
在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;
获取存储的候选句向量;
基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;
根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。


2.根据权利要求1所述的语义召回方法,其特征在于,所述基于句向量生成器获取所述线上查询数据对应的线上句向量的步骤包括:
基于句向量生成器,获取所述线上查询数据的字向量;
对所述字向量进行多层卷积处理,得到所述线上查询数据的线上句向量。


3.根据权利要求2所述的语义召回方法,其特征在于,所述基于句向量生成器,获取所述线上查询数据的字向量的步骤包括:
基于句向量生成器的标记解析层对所述线上查询数据中的每个字进行ID化处理,得到所述线上查询数据中的每个字对应的ID;
基于所述句向量生成器的嵌入层对所述ID进行特征编码,得到所述线上查询数据中每个字对应的字向量。


4.根据权利要求2所述的语义召回方法,其特征在于,所述对所述字向量进行多层卷积处理,得到所述线上查询数据的线上句向量的步骤包括:
基于卷积神经网络对所述字向量进行多层卷积处理,得到所述线上查询数据对应的语义特征;
将每次得到的所述语义特征拼接在一起,得到所述线上查询数据的线上句向量。


5.根据权利要求1所述的语义召回方法,其特征在于,所述获取存储的候选句向量的步骤包括:
获取问题库中存储的候选问题;
基于所述句向量生成器对所述候选问题进行离线计算,得到所述候选问题对应的候选句向量。


6.根据权利要求5所述...

【专利技术属性】
技术研发人员:骆迅
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1