【技术实现步骤摘要】
对话处理方法、问句改写模型的训练方法及其装置
[0001]本公开涉及自然语言处理
,尤其涉及一种对话处理方法、问句改写模型的训练方法及其装置。
技术介绍
[0002]目前,在多轮对话系统中,用户提出的问句中存在信息缺失的情况(如,省略和指代)。当问句中的关键成分缺失时,导致系统无法准确应答。例如。用户问句“什么意思”就是属于信息缺失的情况,系统仅根据这个问句的内容很难判断出用户在咨询哪方面的问题。
[0003]相关技术中,通过从聊天内容中获取内容,将获取的内容直接拼接在句尾的方式或将获取的内容插入到用户问句中,实现用户问句的完整,但是,从聊天内容中获取的内容可能与用户问句无关,将与用户问句无关的内容插入到用户问句中,导致用户问句出现较大偏差,影响用户体验。
技术实现思路
[0004]本公开旨在至少在一定程度上解决上述技术中的技术问题之一。
[0005]为此,本公开提出一种对话处理方法,以实现在用户问句存在信息缺失的情况下,将用户问句和历史对话内容输入到问句改写模型的编码层中,得到历史对话 ...
【技术保护点】
【技术特征摘要】
1.一种对话处理方法,其特征在于,所述方法应用在对话系统中,所述对话系统中具有问句改写模型,所述问句改写模型包括编码层和解码层,所述编码层包括语义表示层和关键词分析层,所述方法包括:获取待回复的用户问句;在确定所述用户问句存在信息缺失的情况下,获取所述用户问句的历史对话内容,其中,所述用户问句所在的轮次与所述历史对话内容所在的轮次之间的轮次差值小于预设轮次阈值;将所述历史对话内容和所述用户问句输入到所述语义表示层,以得到所述历史对话内容中各个词语的语义表示向量和所述用户问句中各个词语的语义表示向量;将所述历史对话内容中各个词语的语义表示向量输入到所述关键词分析层中,以得到所述历史对话内容中各个词语的关键词得分;将所述用户问句中各个词语的语义表示向量、所述历史对话内容中各个词语的语义表示向量和关键词得分输入到所述解码层,以得到信息完整的改写后的用户问句;获取与所述改写后的用户问句的回复信息,并输出所述回复信息。2.如权利要求1所述的方法,其特征在于,所述将所述历史对话内容中各个词语的语义表示向量输入到所述关键词分析层中,以得到所述历史对话内容中各个词语的关键词得分,包括:根据所述多个词语中各个词语的语义表示向量,确定各个词语之间的语义相关度;根据各个词语之间的语义相关度,确定各个词语的关键词得分。3.如权利要求2所述的方法,其特征在于,所述根据各个词语之间的语义相关度,确定各个词语的关键词得分,包括:根据各个词语之间的语义相关度,确定各个词语的重要性得分;根据各个词语的重要性得分,确定各个词语的关键词得分。4.如权利要求1
‑
3任一项所述的方法,其特征在于,所述将所述用户问句中各个词语的语义表示向量、所述历史对话内容中各个词语的语义表示向量和关键词得分输入到所述解码层,以得到信息完整的改写后的用户问句,包括:对所述用户问句中各个词语的语义表示向量进行解码,以得到所述用户问句;根据所述历史对话内容中各个词语的语义表示向量,确定所述历史对话内容中各个词语的初始词汇概率;根据所述历史对话内容中各个词语的语义表示向量的关键词得分和初始词汇概率,确定所述历史对话内容中各个词语的目标词汇概率;根据所述历史对话内容中各个词语的目标词汇概率,选择出目标词汇概率最大的词语作为目标词语;根据所述目标词语,对所述用户问句所缺失的信息进行填充,以得到信息完整的改写后的用户问句。5.如权利要求1
‑
3任一项所述的方法,其特征在于,在所述将所述历史对话内容和所述用户问句输入到所述语义表示层,以得到所述历史对话内容中各个词语的语义表示向量和所述用户问句中各个词语的语义表示向量之前,所述方法还包括:对所述历史对话内容进行分词,以得到所述历史对话内容中的各个词语;
将所述历史对话内容中的各个词语,与噪声词表中的噪声词进行匹配;将所述历史对话内容中与所述噪声词匹配的词语删除。6.一种问句改写模型的训练方法,其特征在于,所述问句改写模型包括编码层和解码层,所述编码层包括语义表示层和关键词分析层,所述方法包括:获取训练数据,其中,所述训练数据包括样本用户问句、所述样本用户问句的样本历史对话内容和所述样本用户问句的改写后的第一样本用户问句,其中,所述样本用户问句存在信息缺失,所述样本用户问句所在的轮次与所述样本历史对话内容所在的轮次之间的轮次差值小于预设轮次阈值;将所述样本历史对话内容和所述样本用户问句输入到所述语义表示层,以得到所述样本历史对话内容中各个词语的语义表示向量和所述样本用户问句中各个词语的语义表示向量;将所述样本历史对话内容中各个词语的语义表示向量输入到关键词分析层中,以得到所述样本历史对话内容中各个词语的关键词得分;将所述样本用户问句中各个词语的语义表示向量、所述样本历史对话内容中各个词语的语义表示向量和关键词得分输入到解码层,以得到信息完整的改写后的第二样本用户问句;根据所述改写后的第一样本用户问句和所述改写后的第二样本用户问句对所述问句改写模型进行训练。7.如权利要求6所述的方法,其特征在于,所述将所述样本历史对话内容中各个词语的语义表示向量输入到所述关键词分析层中,以得到所述样本历史对话内容中各个词语的关键词得分,包括:根据所述多个词语中各个词语的语义表示向量,确定各个词语之间的语义相关度;根据各个词语之间的语义相关度,确定各个词语的关键词得分。8.如权利要求7所述的方法,其特征在于,所述根据各个词语之间的语义相关度,确定各个词语的关键词得分,包括:根据各个词语之间的语义相关度,确定各个词语的重要性得分;根据各个词语的重要性得分,确定各个词语的关键词得分。9.一种对话处理装置,其特征在于,所述装置应用在对话系统中,所述对话系统中具有问句改写模型,所述问句改写模型包括...
【专利技术属性】
技术研发人员:刘航,陈蒙,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。