用于生成对话语句的方法、装置、设备、介质和程序产品制造方法及图纸

技术编号：32474191 阅读：13 留言：0更新日期：2022-03-02 09:35

本公开实施例公开了一种用于生成对话语句的方法、装置、设备、介质和程序，其中，方法包括：响应于用户发送的当前语句，生成当前语句的词集合；确定词元素的第一重要性权重；基于当前对话场景中的历史对话语句的语义关系，确定词元素的第二重要性权重；基于第一重要性权重和第二重要性权重，确定词元素的重要性参数；确定当前语句的语料召回池，语料召回池中的候选回复语料包括基于重要性参数从第一索引库中检索出的第一语料以及基于历史对话语句与预设语料的相似度从第二索引库中检索出的第二语料；将语料召回池中与当前语句的匹配程度最高的候选回复语料确定为目标回复语句。可以充分利用历史对话记录中的上下文信息，从而提高对话质量。而提高对话质量。而提高对话质量。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成对话语句的方法、装置、设备、介质和程序产品

[0001]本公开涉及一种用于生成对话语句的方法、装置、电子设备、存储介质和计算机程序。

技术介绍

[0002]目前，智能会话系统(例如机器人客服、聊天机器人等)在日常生活中的应用越来越广泛，例如可以用来满足家庭陪护、医疗、教育、政务机关、银行、旅游等行业场景的需求。通常，智能会话系统在接收到用户发送的语句后，可以自动生成相应的回复，以此实现人与机器之间的对话。在这个过程中，智能会话系统生成的回复与用户发送的语句之间的匹配程度，直接关系到人与机器之间的对话质量。
[0003]相关技术中，智能会话系统通常是针对用户在单轮对话中发送的语句，从预先构建的语料库中检索出对应的回复语句，以此实现智能对话。

技术实现思路

[0004]本公开实施例提供一种一种用于生成对话语句的方法、装置、电子设备、存储介质和计算机程序，以提高智能对话系统中对话语句的针对性。
[0005]本公开实施例的一个方面，提供一种用于生成对话语句的方法，包括：响应于用户发送的当前语句，生成当前语句的词集合，词集合中的词元素包括对当前语句分词得到的词语以及基于词语构建的词组；确定词元素的第一重要性权重；基于当前对话场景中的历史对话语句的语义关系，确定词元素的第二重要性权重；基于第一重要性权重和第二重要性权重，确定词元素的重要性参数；确定当前语句的语料召回池，语料召回池中的候选回复语料包括基于重要性参数从第一索引库中检索出的第一语料以及基于历史对话语句与预设语料的相似度从第二索引...

【技术保护点】

【技术特征摘要】
1.一种用于生成对话语句的方法，其特征在于，包括：响应于用户发送的当前语句，生成所述当前语句的词集合，所述词集合中的词元素包括对所述当前语句分词得到的词语以及基于所述词语构建的词组；确定所述词元素的第一重要性权重；基于当前对话场景中的历史对话语句的语义关系，确定所述词元素的第二重要性权重；基于所述第一重要性权重和所述第二重要性权重，确定所述词元素的重要性参数；确定所述当前语句的语料召回池，所述语料召回池中的候选回复语料包括基于所述重要性参数从第一索引库中检索出的第一语料以及基于所述历史对话语句与预设语料的相似度从第二索引库中检索出的第二语料；将所述语料召回池中与所述当前语句的匹配程度最高的候选回复语料确定为目标回复语句。2.根据权利要求1所述的方法，其特征在于，将所述语料召回池中与所述当前语句的匹配程度最高的候选回复语料确定为目标回复语句，包括：将所述候选回复语料、所述当前语句和所述历史对话语句输入预先训练的至少一个语料确定模型，确定第一特征向量以及所述候选回复语料对应的第二特征向量和第三特征向量，其中，所述第一特征向量表征所述当前语句与所述历史对话语句拼接得到的句子的句向量，所述第二特征向量表征将所述候选回复语料与所述历史对话语句拼接得到的句子的句向量，所述第三特征向量表征所述候选回复语料的句向量；将所述第一特征向量、所述第二特征向量和所述第三特征向量拼接，得到所述候选回复语料的目标特征向量；将所述目标特征向量输入全连接层，估计所述候选回复语料分别对应于预设的各优先级标签的置信度，所述优先级标签表征所述候选回复语料与所述当前语句的匹配程度；将各所述置信度输入预先构建的分类器，确定所述候选回复语料的优先级标签；基于所述优先级标签，从所述语料召回池中确定所述目标回复语句。3.根据权利要求2所述的方法，其特征在于，所述至少一个语料确定模型经由如下步骤训练得到：从样本对话日志中提取样本语句；基于对话次序，从所述样本对话日志中确定每个所述样本语句对应的第一预设数量个回复语句以及第二预设数量个样本历史对话语句，其中，所述第一预设数量个回复语句发生在所述样本语句之后且与所述样本语句的对话次序相邻，所述第二预设数量个样本历史对话语句发生在所述样本语句之前；基于预设的优先级标签，分别对所述第一预设数量个回复语句标记样本标签，得到第一预设数量个样本回复语句；基于所述样本语句、所述第一预设数量个样本回复语句以及所述第二预设数量个样本历史对话语句，构建样本语料，得到样本集；将所述样本集中的样本语料输入预先构建的至少一个初始语料确定模型，将所述样本回复语句的样本标签作为期...

【专利技术属性】
技术研发人员：王文彬，
申请(专利权)人：北京房江湖科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人