【技术实现步骤摘要】
一种基于个性扩展的对话生成方法
[0001]本专利技术涉及自然语言处理技术,尤其涉及一种基于个性扩展的对话生成方法。
技术介绍
[0002]传统的个性对话方法通常基于特定个性集合完成对话生成,但固定的预定义个性集合无法表示机器人的完整个性,在对话响应的生成过程中容易触发个性缺失问题。当前大多数研究工作基于深度循环神经网络和Transformer等技术对预定义个性进行编码,尽管这些模型能够对预定义个性进行充分的语义理解,但固定的预定义个性无法覆盖所有类型的用户提问,具有明显的缺点。同时当前的工作只关注于以同等权重混合所有个性信息,忽略了实际个性对话生成过程中不同个性的作用存在差异,因此具有很大的局限性。
技术实现思路
[0003]本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种基于个性扩展的对话生成方法,该方法能有效提高对话生成结果的个性一致性。
[0004]本专利技术解决其技术问题所采用的技术方案是:一种基于个性扩展的对话生成方法,包括以下步骤:
[0005]1)根据用户查询和预定 ...
【技术保护点】
【技术特征摘要】
1.一种基于个性扩展的对话生成方法,其特征在于,包括以下步骤:1)根据用户查询和预定义个性信息进行对话个性扩展;1.1)预测查询和候选个性之间的相关性;1.2)采用自然语言推断模型评估候选个性与预定义个性集合的逻辑关联;对于所有候选个性,依据查询和候选个性之间的相关性和候选个性与预定义个性集合的逻辑关联的联合得分对候选个性进行排序,得分最高者即为扩展个性;2)基于先后验网络构建个性集合的重要性分布模型,获得个性重要性分布;先后验网络中,后验网络以用户查询、个性集合、目标响应作为输入,训练目标即判别每个个性信息是否在目标响应中被采用;先验网络以用户查询、个性集合作为输入,训练目标即对个性的判别结果与后验网络尽可能趋于一致;采用GPT将用户查询、预定义个性、目标响应分别编码为句向量表征E
pi
;其中,先后验网络中用于编码个性重要性的注意力网络定义如下:其中,先后验网络中用于编码个性重要性的注意力网络定义如下:其中,表示先验(pri)或后验(post)网络中每个个性的重要性;采用前馈神经网络配合sigmoid激活函数,将它们转换为先验pri或后验post网络中每个个性的权重:3)根据基于后验网络预测的个性重要性分布,使用加权后的个性信息进行响应解码;采用加权方法对所有个性表征进行融合,在训练过程中,基于后验网络的预测结果进行个性融合:其中,n
p
代表个性集合中的个性总数,代表t时刻下与已生成部分进行注意力交互后的第i条个性的表征;采用平均池化对于解码所需的用户查询、个性信息、已解码部分进行融合,然后利用GPT解码该时刻的响应单词r
t
::4)响应推断,生成查询的对话文本;采用...
【专利技术属性】
技术研发人员:魏巍,刘逸帆,刘家邑,汤鑫,郑文俊,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。