信息生成方法及装置制造方法及图纸

技术编号:19692219 阅读:32 留言:0更新日期:2018-12-08 11:17
本发明专利技术实施例提供一种信息生成方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容;将问询文本及关键内容输入至回复生成模型,输出对关键内容进行调整后得到的答复信息。由于可通过回复生成模型对关键内容进行调整,从而可筛选掉关键内容中与用户提问没有直接关联的内容,并加深对关键内容中与用户提问相关的信息挖掘,进而保证答复信息的准确性。另外,由于还可通过回复生成模型调整关键内容的表述方式,从而使得调整后得到的答复信息更加人性化,进而提高后续用户的交互体验。

【技术实现步骤摘要】
信息生成方法及装置
本专利技术实施例涉及自然语言处理
,更具体地,涉及一种信息生成方法及装置。
技术介绍
近年来,随着人工智能相关学科,特别是计算语言学的发展,各种各样的问答系统和对话机器人应运而生,人们可通过以自然语言的方式与设备进行沟通,获取所需要的信息。在相关技术中,通常是直接查找到用户提问的相关回答作为答复信息。由于查找到的相关回答可能包含与用户提问没有直接联系的内容,从而导致答复信息的准确性低。
技术实现思路
为了解决上述问题,本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的一种信息生成方法及装置。根据本专利技术实施例的第一方面,提供了一种信息生成方法,该方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容;将问询文本及关键内容输入至回复生成模型,输出对关键内容进行调整后得到的答复信息;其中,回复生成模型是基于样本问询文本、样本问询文本对应的样本关键内容及样本答复信息进行训练后得到的。本专利技术实施例提供的方法,通过将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容。将问询文本及关键内容输入至回复生成模型,输出对关键内容进行调整后得到的答复信息。由于可通过回复生成模型对关键内容进行调整,从而可筛选掉关键内容中与用户提问没有直接关联的内容,并加深对关键内容中与用户提问相关的信息挖掘,进而保证答复信息的准确性。另外,由于还可通过回复生成模型调整关键内容的表述方式,从而使得调整后得到的答复信息更加人性化,进而提高后续用户的交互体验。根据本专利技术实施例的第二方面,提供了一种信息生成装置,该装置包括:第一输出模块,用于将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容;第二输出模块,用于将问询文本及关键内容输入至回复生成模型,输出对关键内容进行调整后得到的答复信息;其中,回复生成模型是基于样本问询文本、样本问询文本对应的样本关键内容及样本答复信息进行训练后得到的。根据本专利技术实施例的第三方面,提供了一种信息生成设备,包括:至少一个处理器;以及与处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的信息生成方法。根据本专利技术的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的信息生成方法。应当理解的是,以上的一般描述和后文的细节描述是示例性和解释性的,并不能限制本专利技术实施例。附图说明图1为本专利技术实施例的一种信息生成方法的流程示意图;图2为本专利技术实施例的一种信息生成方法的流程示意图;图3为本专利技术实施例的一种关键内容计算模型的结构示意图;图4为本专利技术实施例的一种信息生成方法的流程示意图;图5为本专利技术实施例的一种信息生成方法的流程示意图;图6为本专利技术实施例的一种信息生成方法的流程示意图;图7为本专利技术实施例的一种回复生成模型的结构示意图;图8为本专利技术实施例的一种信息生成装置的框图;图9为本专利技术实施例的一种信息生成设备的框图。具体实施方式下面结合附图和实施例,对本专利技术实施例的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术实施例,但不用来限制本专利技术实施例的范围。目前人们可通过以自然语言的方式与设备进行沟通,获取所需要的信息。在相关技术中,通常是将直接查找到用户提问的相关回答作为答复信息。由于查找到的相关回答可能包含与用户提问没有直接联系的内容,从而导致答复信息的准确性低。例如,以用户提问为“车内空调怎么调高温度”,而查找到用户提问的相关回答为“温度调节旋钮操作,顺时针旋转温度增加,逆时针旋转温度降低”为例,若将相关回答作为答复信息,由于相关回答包含与用户提问无关的内容,从而导致答复信息的准确性低。另外,由于答复信息的内容在表述上可能不符合人与人之间的对话习惯,也即不够人性化,从而导致用户体验较差。针对上述情形,本专利技术实施例提供了一种信息生成方法。该方法可以用于智能问答场景,也可以用于需要智能问答功能的其它场景,如驾驶场景、购物场景等,本专利技术实施例对此不作具体限定。结合不同的使用场景,该方法可以由不同的设备执行,本专利技术实施例对此也不作具体限定。例如,若该方法用于驾驶场景,则该方法的执行主体可以为车载设备;若该方法用于购物场景,则该方法的执行主体可以为移动终端。参见图1,该方法包括:101、将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容。在执行上述过程之前,可先获取用户提问时的语音数据,并对语音数据进行语音识别以得到问询文本;或者,还可以直接获取用户输入的文本并作为问询文本,本专利技术实施例对此不作具体限定。另外,与问询文本相匹配的答复文本,可包含问询文本对应提问的答复内容。具体地,若问询文本对应提问为询问一项产品中某项功能如何使用,则与问询文本相匹配的答复文本可以为该产品的说明文档;进一步地,考虑到一项产品中通常具有多项功能,而该产品的说明文档中通常会记在该产品所有功能的使用说明信息,若预先按照每项功能将说明文档拆分成若干个结构化文本,而问询文本询问的是产品中的某项功能,则与问询文本相匹配的答复文本可以为该功能对应的结构化文本。若问询文本对应提问为一个技术术语的定义,则答复文本可以为包含该技术术语定义的技术词典,本专利技术实施例对此不作具体限定。由于答复文本中可能会包含一些与问询文本对应提问无关的冗余信息,从而可基于关键内容计算模型输出答复文本中的关键内容。其中,关键内容可以为问询文本对应提问的答复内容,本专利技术实施例对此不作具体限定。另外,在执行上述过程之前,还可预先训练得到关键内容计算模型,具体可通过如下方式训练得到:首先,收集大量样本问询文本、样本问询文本对应的样本答复文本;其中,样本答复文本中的样本关键内容是预先确定的,且为样本问询文本对应提问的答复内容。基于样本问询文本、样本答复文本和样本关键内容对初始模型进行训练,从而得到关键内容计算模型。其中,初始模型可以是单一神经网络模型,也可以是多个神经网络模型的组合,本专利技术实施例不对初始模型的类型和结构作具体限定。102、将问询文本及关键内容输入至回复生成模型,输出对关键内容进行调整后得到的答复信息。由上述内容可知,关键内容在表述上可能不符合人与人之间的对话习惯,也即不够人性化;或者,关键内容包含一些与问询文本对应提问无关的内容。因此,在本专利技术实施例中,不直接向用户反馈(如通过播报的方式)关键内容,而是通过回复生成模型对关键内容进行调整,并得到调整后的答复信息,从而后续可将答复信息反馈至用户。在执行上述过程之前,还可预先训练得到回复生成模型,具体可通过如下方式训练得到:首先,收集大量样本问询文本、样本问询文本对应的样本关键内容以及样本答复信息;其中,样本答复信息是预先对样本关键内容进行调整后得到的。将样本问询文本及样本关键内容作为初始模型的输入,将样本答复信息作为初始模型的输出,对初始模型进行训练,从而得到回复生成模型。其中,初始模型可以是单一神经网络模型,也可以是多个神经网络模型的组本文档来自技高网...

【技术保护点】
1.一种信息生成方法,其特征在于,包括:将问询文本和与所述问询文本相匹配的答复文本输入至关键内容计算模型,输出所述答复文本中的关键内容;将问询文本及所述关键内容输入至回复生成模型,输出对所述关键内容进行调整后得到的答复信息;其中,所述回复生成模型是基于样本问询文本、所述样本问询文本对应的样本关键内容及样本答复信息进行训练后得到的。

【技术特征摘要】
1.一种信息生成方法,其特征在于,包括:将问询文本和与所述问询文本相匹配的答复文本输入至关键内容计算模型,输出所述答复文本中的关键内容;将问询文本及所述关键内容输入至回复生成模型,输出对所述关键内容进行调整后得到的答复信息;其中,所述回复生成模型是基于样本问询文本、所述样本问询文本对应的样本关键内容及样本答复信息进行训练后得到的。2.根据权利要求1所述的方法,其特征在于,所述将问询文本和与所述问询文本相匹配的答复文本输入至关键内容计算模型,输出所述答复文本中的关键内容,包括:将所述问询文本及所述答复文本分别输入至所述关键内容计算模型中的文本表示层,输出所述问询文本对应的词级别文本表示矩阵以及所述答复文本对应的句级别文本表示矩阵;将所述句级别文本表示矩阵输入至所述关键内容计算模型中的上下文表示层,输出所述答复文本对应的上下文表示矩阵;将所述词级别文本表示矩阵及所述上下文表示矩阵输入至所述关键内容计算模型中的注意力层,输出所述问询文本与所述答复文本之间的信息关联矩阵;将所述信息关联矩阵输入至所述关键内容计算模型中的输出层,输出所述答复文本中的关键内容。3.根据权利要求1所述的方法,其特征在于,所述将问询文本及所述关键内容输入至回复生成模型,输出对所述关键内容进行调整后得到的答复信息,包括:将所述问询文本及所述关键内容分别输入至向量表示层,输出所述问询文本对应的第一词向量矩阵及所述关键内容对应的第二词向量矩阵;将所述第一词向量矩阵及所述第二词向量矩阵输入至编码层,输出编码向量,将所述编码向量输入至解码层,输出解码向量;将所述解码向量输入至输出层,逐一输出所述答复信息中的每一分词,按照每一分词的输出顺序,将所有输出的分词进行拼接,得到所述答复信息。4.根据权利要求3所述的方法,其特征在于,所述向量表示层包括输入层和嵌入层;所述将所述问询文本及所述关键内容分别输入至向量表示层,输出所述问询文本对应的第一词向量矩阵及所述关键内容对应的第二词向量矩阵,包括:将所述问询文本对应的第一分词序列及所述关键内容对应的第二分词序列输入至所述输入层,输出所述第一分词序列中每一分词的词标识及所述第二分词序列中每一分词的词标识;将所述第一分词序列中每一分词的词标识及所述第二分词序列中每一分词的词标识输入至所述嵌入层,输出所述第一词向量矩阵及所述第二词向量矩阵。5.根据权利要求3所述的方法,其特征在于,所述编码层包括正向长短期记忆网络及反向长短期记忆网络;相应地,所述将所述第一词向量矩阵及所述...

【专利技术属性】
技术研发人员:马文涛崔一鸣陈致鹏何苏王士进胡国平刘挺
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1