【技术实现步骤摘要】
信息处理方法及装置、存储介质和处理器
本专利技术涉及信息处理
,具体而言,涉及一种信息处理方法及装置、存储介质和处理器。
技术介绍
目前智能应答的应用非常的广泛,例如,许多电商商家采用聊天机器人回复客户问题,在客户与聊天机器人对话的过程中,聊天机器人选择回复客户的答案时,通常会基于神经网络来进行多轮对话与答复之间的建模,比较常见的方法有两种:基于句子向量和基于层级结构的多轮对话选择回复内容。基于句子语义向量的方法一般是先把多轮对话的多句子进行拼接,然后用神经网络进行句子编码得到一个向量。同样,对于答复也进行类似的编码,得到另一个向量。最后通过计算两个向量之间的距离,选择最近距离的答复向量作为预测答复。这种方案的缺点是句子编码成向量后易丢失信息,导致对候选答复的召回率不高。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种信息处理方法及装置、存储介质和处理器,以至少解决由于句子编码成向量后易丢失信息,导致对候选答复的召回率不高的技术问题。根据本专利技 ...
【技术保护点】
1.一种信息处理方法,其特征在于,包括:/n获取用户与机器人的多个对话文本和多个候选答复文本,其中,所述候选答复文本预先存储在数据库中;/n对每个对话文本进行分词处理,得到多个对话文本分词集合,对每个候选答复文本进行分词处理,得到多个答复文本的分词集合;/n将所述多个对话文本分词集合中分词进行拼接,得到拼接后的分词集合;/n将所述拼接后的分词集合和所述多个答复文本的分词集合输入至逻辑序列推理模型,得到每个候选答复文本与所述拼接后的分词集合的相关性得分;/n基于每个候选答复文本与所述拼接后的分词集合的相关性得分,确定答复文本。/n
【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:
获取用户与机器人的多个对话文本和多个候选答复文本,其中,所述候选答复文本预先存储在数据库中;
对每个对话文本进行分词处理,得到多个对话文本分词集合,对每个候选答复文本进行分词处理,得到多个答复文本的分词集合;
将所述多个对话文本分词集合中分词进行拼接,得到拼接后的分词集合;
将所述拼接后的分词集合和所述多个答复文本的分词集合输入至逻辑序列推理模型,得到每个候选答复文本与所述拼接后的分词集合的相关性得分;
基于每个候选答复文本与所述拼接后的分词集合的相关性得分,确定答复文本。
2.根据权利要求1所述的方法,其特征在于,将所述拼接后的分词集合和所述多个答复文本的分词集合输入至逻辑序列推理模型,得到每个候选答复文本与所述拼接后的分词集合的相关性得分包括:
获取所述拼接后的分词集合的语义向量和每个答复文本的分词集合的语义向量;
采用注意力机制获取所述拼接后的分词集合的语义向量对应的向量,得到第一向量,其中,所述第一向量是所述拼接后的分词集合的语义向量和所述注意力机制加权后得到的向量拼接后的向量;
采用注意力机制获取每个答复文本的分词集合的语义向量对应的向量,得到多个第二向量,其中,所述第二向量是答复文本的分词集合的语义向量和所述注意力机制加权后得到的向量拼接后的向量;
将所述第一向量与每个第二向量进行组合,以获取所述拼接后的分词集合与每个答复文本的分词集合之间的语义关系;
对所述拼接后的分词集合与每个答复文本的分词集合之间的语义关系进行打分,得到每个候选答复文本与所述拼接后的分词集合的相关性得分。
3.根据权利要求1所述的方法,其特征在于,还包括:
在所述多个对话文本分词集合中分词进行拼接,得到拼接后的分词集合之后,对所述拼接后的分词集合进行语义编码,得到对话文本的语义向量,对所述多个答复文本的分词集合中每个答复文本的分词集合进行语义编码,得到多个答复文本的语义向量;
计算所述对话文本的语义向量与每个答复文本的语义向量之间的相关性得分;
确定预设数量个候选答复文本,其中,所述预设数量个候选答复文本中的候选答复文本与所述对话文本的语义向量的相关性得分大于预设阈值;
将所述预设数量个候选答复文本和所述拼接后的分词集合输入至所述逻辑序列推理模型,重新计算所述预设数量个候选答复文本中每个候选答复文本与所述拼接后的分词集合的相关性得分;
基于所述预设数量个候选答复文本中每个候选答复文本与所述拼接后的分词集合的相关性得分,确定所述答复文本。
4.根据权利要求3所述的方法,其特征在于,将所述预设数量个候选答复文本和所述拼接后的分词集合输入至所述逻辑序列推理模型,重新计算所述预设数量个候选答复文本中每个候选答复文本与所述拼接后的分词集合的相关性得分包括:
获取所述拼接后的分词集合的语义向量和每个候选答复文本的分词集合的语义向量;
采用注意力机制获取所述拼接后的分词集合的语义向量对应的向量,得到第一向量,其中,所述第一向量是所述拼接后的分词集合的语义向量和所述注意力机制加权后得到的向量拼接后的向量;
采用注意力机制获取每个答复文本的分词集合的语义向量对应的向量,得到多个第二向量,其中,所述第二向量是每个答复文本的分词集合的语义向量和所述注意力机制加权后得到的向量拼接后的向量;
将所述第一向量与每个第二向量进行组合,以获取所述拼接后的分词集合与每个答复文本的分词集合之间的语义关系;
对所述拼接后的分词集合与每个答复文本的分词集合之间的语义关系进行打分,重新得到所述预设数量个候选答复文本中每个候选答复文本与所述拼接后的分词集合的相关性得分。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
重新得到所述预设数量个候选答复文本中每个候选答复文本与所述拼接后的分词集合的相关性得分之后,基于相关性得分对所述预设数量个候选答复文本进行重新排序,将所述预设数量个候选答复文本中相关性得分满足预设条件的候选答复文本作为所述答复文本。
6.根据权利要求3所述的方法,其特征在于,计算所述对话文本的语义向量与每个答复文本的语义向量之间的相关性得分采用以下任一方式:多层感知器、余弦距离、欧式距离。
7.根据权利要求1所述的方法,其特征在于,基于每个...
【专利技术属性】
技术研发人员:陈谦,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。