【技术实现步骤摘要】
确定查询文本所对应标准文本的方法及装置
本说明书实施例涉及自然语言处理
,具体地,涉及一种通过计算机执行的确定查询文本所对应标准文本的方法及装置。
技术介绍
目前,客服平台通常会先使用机器人客服与用户进行交互,并期望根据用户描述能够确定用户意图,进而为用户提供相应的解决方案。然而,用户描述通常比较口语化,并且在某些情况下,描述的问题比较复杂,导致机器人客服难以准确识别用户意图。同时,越来越多的用户使用客服服务,用户对客服服务的使用频次也越来越高,这无疑对机器人客服识别用户意图的速度、准确率提出了更高要求。因此,迫切需要一种可靠的方案,可以提高识别用户意图的准确率和速度,从而提高用户体验。
技术实现思路
本说明书一个或多个实施例描述确定查询文本所对应标准文本的方法及装置,可以根据用户输入的查询文本,快速、准确地确定出与该查询文本对应的标准文本,进而及时向用户展示该标准文本,充分提高用户体验。根据第一方面,提供一种确定查询文本所对应标准文本的方法,所述方法包括:获取用户输入的查询文本;将 ...
【技术保护点】
1.一种确定查询文本所对应标准文本的方法,包括:/n获取用户输入的查询文本;/n将所述查询文本输入基于Bert的第一语义模型中,得到查询语义向量,所述第一语义模型至少基于多个历史查询文本而预先训练得到;/n获取若干候选文本,所述若干候选文本是根据所述查询文本检索标准文本库而确定;/n获取所述若干候选文本对应的若干候选语义向量,所述若干候选语义向量通过基于Bert的第二语义模型而确定,所述第二语义模型至少基于多个标准文本而预先训练得到;/n将所述查询语义向量分别与若干候选语义向量进行综合处理,得到若干综合向量;/n分别将所述若干综合向量输入预先训练的关联度预测模型,得到所述查 ...
【技术特征摘要】
1.一种确定查询文本所对应标准文本的方法,包括:
获取用户输入的查询文本;
将所述查询文本输入基于Bert的第一语义模型中,得到查询语义向量,所述第一语义模型至少基于多个历史查询文本而预先训练得到;
获取若干候选文本,所述若干候选文本是根据所述查询文本检索标准文本库而确定;
获取所述若干候选文本对应的若干候选语义向量,所述若干候选语义向量通过基于Bert的第二语义模型而确定,所述第二语义模型至少基于多个标准文本而预先训练得到;
将所述查询语义向量分别与若干候选语义向量进行综合处理,得到若干综合向量;
分别将所述若干综合向量输入预先训练的关联度预测模型,得到所述查询文本与所述若干候选文本之间的若干关联度,以用于从所述若干候选文本中确定所述查询文本所对应的标准文本。
2.根据权利要求1所述的方法,其中,获取若干候选文本,包括:
确定所述查询文本中包括的查询关键词;
根据所述查询关键词对所述标准文本库进行检索,得到匹配所述查询关键词的文本,作为所述若干候选文本。
3.根据权利要求1所述的方法,其中,所述若干候选文本中包括任意的第一候选文本,所述若干候选语义向量中包括对应于所述第一候选文本的第一候选语义向量;获取所述若干候选文本对应的若干候选语义向量,包括:
查询缓存中是否存在与所述第一候选文本相同的第一标准文本;
当存在所述第一标准文本时,从所述缓存中获取与所述第一标准文本对应的标准语义向量,作为所述第一候选语义向量。
4.根据权利要求3所述的方法,其中,在查询缓存中是否存在与所述第一候选文本相同的第一标准文本之后,所述方法还包括:
当不存在所述第一标准文本时,将所述第一候选文本输入所述第二语义模型中,得到所述第一候选语义向量;
将所述第一候选文本和所述第一候选语义向量分别归为标准文本和标准语义向量,关联存储至所述缓存中。
5.根据权利要求1所述的方法,其中,所述若干候选语义向量中包括任意的第一候选语义向量,所述查询语义向量和所述第一候选语义向量具有相同的维度;将所述查询语义向量分别与若干候选语义向量进行综合处理,得到若干综合向量,包括:
对所述查询语义向量和所述第一候选语义向量进行对位点乘,得到所述第一综合向量。
6.根据权利要求1所述的方法,其中,所述若干候选语义向量中包括任意的第一候选语义向量;将所述查询语义向量分别与若干候选语义向量进行综合处理,得到若干综合向量,包括:
对所述查询语义向量和所述第一候选语义向量进行拼接,得到所述第一综合向量。
7.根据权利要求1所述的方法,其中,在分别将所述若干综合向量输入预先训练的关联度预测模型,得到所述查询文本与所述若干候选文本之间的若干关联度之后,所述方法还包括:
确定所述若干关联度中的最大值;
在所述最大值不小于预定阈值的情况下,将所述最大值所对应的候选文本作为所述查询文本所对应的标准文本,以用于向用户展示。
8.根据权利要求7所述的方法,其中,在确定所述若干关联度中的最大值之后,所述方法还包括:
在所述最大值小于预定阈值的情况下,基于所述若干关联度对所述若干候选文本进行排序;
将排序结果中位于预定名次内的候选文本作为所述查询文本所对应标准文本列表,以用于向用户展示。
9.根据权利要求1所述的方法,其中,在分别将所述若干综合向量输入预先训练的关联度预测模型,得到所述查询文本与所述若干候选文本之间的若干关联度之后,所述方法还包括:
基于所述若干关联度对所述若干候选文本进行排序;
将排序结果中位于预定名次内的候选文本作为所述查询文本所对应标准文本列表,以用于向用户展示。
10.根据权利要求1所述的方法,其中,所述关联度预测模型基于深度神经网络DNN或ResNet。
11.根据权利要求1所述的方法,其中,所述关联度预测模型基于以下步骤而预先训练:
获取多个文本对和对应的多个文本关联标签,其中每个文本对中包括对应的历史查询文本和标准文本,每个文本关联标签用于指示每个文本对中文本之间的关联等级;
利用所述多个文本对和对应的多个文本关联标签,以及所述第一语义模型和所述第二语义模型,训练所述关联度预测模型。
12.根据权利要求11所述的方法,其中,所述多个文本对中包括第一文本对和第二文本对,所述第一文本对包括某一历史查询文本和第一标准文本,所述第二文本对包括同一历史查询文本和第二标准文本;训练所述关联度预测模型,包括:
利用第一语义模型、第二语义模型和关联度预测模型,预测所述第一文本对所对应的第一文本关联度;
利用第一语义模型、第二语义模型和关联度预测模型,预测所述第二文本对所对应的第二文本关联度;
基于所述第一文本关联度和第二文本关联度,确定针对所述同一历史查询文本,所述第一标准文本排在第二标准文本之前的预测概率;
基于所述第一文本对和第二文本对所对应的两个文本关联标签,确定针对所述同一历史查询文本,所述第一标准文本排在第二标准文本之前的真实概率;
基于所述预测概率和所述真实概率,确定预测损失,用于训练所述关联度预测模型。
13.一种确定查询文本所对应标准文本的装置,包括:
第一获取单元,配置为获取用户输入的...
【专利技术属性】
技术研发人员:张望舒,温祖杰,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。