问答处理方法、装置、设备制造方法及图纸

技术编号:27436837 阅读:23 留言:0更新日期:2021-02-25 03:28
本发明专利技术实施例提供一种问答处理方法、装置、设备,该问答处理方法包括:在第一时间接收到针对目标物品的第一问题语句,将第一问题语句输入到模型中,以通过模型获取与第一问题语句对应的属性,其中,模型从与目标物品关联的问答语句对中已经获取到所述属性以及属性值;获取与目标物品的所述属性对应的第一答复语句,第一答复语句中包括所述属性值,输出第一答复语句,从而实现了对用户提出的问题的自动应答。另外,通过问答语句的联合训练使得该模型能够学习到问答语句之间的语义特征,从而使得对这对问答语句中问题语句的属性预测结果以及答复语句的属性值标注结果更加准确。以及答复语句的属性值标注结果更加准确。以及答复语句的属性值标注结果更加准确。

【技术实现步骤摘要】
问答处理方法、装置、设备


[0001]本专利技术涉及互联网
,尤其涉及一种问答处理方法、装置、设备。

技术介绍

[0002]随着互联网技术的发展,人们足不出户地即可从网络中获取自己所需的各种物品和信息。比如,很多在线购物平台(俗称电商平台)的出现,使得人们通过使用相应的购物APP或通过Web访问的方式便可以访问购物平台的服务器,进行商品的搜索、选择、下单等操作,从而获得自己所需的商品。
[0003]买家和卖家的互动交流是商品成交的一个关键因素。在一些实际应用中,卖家对买家提出的问题往往回复不及时,这就会导致买家很有可能丧尸进一步互动的意愿,甚至不再考虑这个卖家的商品。

技术实现思路

[0004]本专利技术实施例提供一种问答处理方法、装置、设备,用以实现对用户提出的咨询问题的自动应答。
[0005]第一方面,本专利技术实施例提供一种问答处理方法,该方法包括:
[0006]在第一时间接收到针对目标物品的第一问题语句;
[0007]将所述第一问题语句输入到模型中,以通过所述模型获取与所述第一问题语句对应的属性;其中,所述模型从与所述目标物品关联的问答语句对中已经获取到所述属性以及属性值;
[0008]获取与所述目标物品的所述属性对应的第一答复语句,所述第一答复语句中包括所述属性值;
[0009]输出所述第一答复语句。
[0010]第二方面,本专利技术实施例提供一种问答处理装置,该装置包括:
[0011]问题接收模块,用于在第一时间接收到针对目标物品的第一问题语句;
[0012]属性预测模块,用于将所述第一问题语句输入到模型中,以通过所述模型获取与所述第一问题语句对应的属性;其中,所述模型从与所述目标物品关联的问答语句对中已经获取到所述属性以及属性值;
[0013]答复获取模块,用于获取与所述目标物品的所述属性对应的第一答复语句,所述第一答复语句中包括所述属性值;
[0014]答复输出模块,用于输出所述第一答复语句。
[0015]第三方面,本专利技术实施例提供一种电子设备,其中包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现第一方面中的问答处理方法。
[0016]本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理
器至少可以实现第一方面中的问答处理方法。
[0017]第四方面,本专利技术实施例提供一种模型训练方法,所述模型包括第一输入层、第二输入层、语句表示层、第一输出层和第二输出层;所述第一输入层和所述第二输入层分别与所述语句表示层连接;所述第一输出层和所述第二输出层分别与所述语句表示层连接;所述模型的训练方法包括:
[0018]获取作为训练样本的问题语句和答复语句,所述问题语句和所述答复语句是一对问答语句;
[0019]通过所述第一输入层对所述问题语句进行词向量编码以得到多个第一词向量,以及通过所述第二输入层对所述答复语句进行词向量编码以得到多个第二词向量;
[0020]通过所述语句表示层提取所述多个第一词向量对应的第一语义表示向量,以及通过所述语句表示层提取所述多个第二词向量对应的第二语义表示向量;
[0021]通过所述第一输出层对所述第一语义表示向量进行分类处理,以获得所述问题语句对应的属性分类结果,以及通过所述第二输出层对所述第二语义表示向量进行序列标注处理,以获得所述答复语句对应的属性值标注结果;
[0022]根据所述属性分类结果确定第一损失函数,以及根据所述属性值标注结果确定第二损失函数;
[0023]根据所述第一损失函数和所述第二损失函数的叠加结果调整所述模型的参数。
[0024]本专利技术实施例中所使用的模型是由已经产生的一对对的问答语句联合训练得到的,也就是说,该模型的一条训练样本由已经产生的一对问答语句组成。通过问答语句的联合训练使得该模型能够学习到问答语句之间的语义信息,从问题语句中学习到的属性信息可以有助于对答复语句中属性值的标注,从答复语句中学习到的属性值信息有助于对问题语句中属性的识别,从而使得对这对问答语句中问题语句的属性预测结果以及答复语句的属性值标注结果更加准确。针对某个目标物品来说,可以将该目标物品下已经产生的问答语句对输入到该模型中,从而使得该模型学习到该问答语句对所对应的属性和属性值,基于该属性值生成与该属性对应的答复语句。
[0025]基于此,当接收到用户针对该目标物品提出的第一问题语句时,将该第一问题语句输入到模型中,以通过该模型获取第一问题语句对应的属性,进而获取与目标物品的该属性对应的第一答复语句,输出该第一答复语句,以实现对用户提出的问题的自动应答。
附图说明
[0026]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1为本专利技术一实施例提供的模型结构的示意图;
[0028]图2为本专利技术一实施例提供的模型训练方法的流程图;
[0029]图3为本专利技术一实施例提供的模型训练过程的原理示意图;
[0030]图4为本专利技术一实施例提供的物品知识库的组成示意图;
[0031]图5为本专利技术一实施例提供的物品知识库的构建过程的流程图;
Short-Term Memory,简称LSTM)、循环神经网络模型(Recurrent Neural Network,简称RNN)等。
[0047]本专利技术实施例提供的问答处理方法可以适用于在线购物的场景中,以在线购物的场景为例,已经训练至收敛的该模型可以被提供给多个商家使用,基于此,该模型可以被多个商家下载至各自对应的商家客户端中,即下载到商家的终端设备中,从而,本专利技术实施例提供的问答处理方法可以由该商家的终端设备来执行。当然,该模型也可以部署在电商平台对应的服务器或服务器集群中,该服务器可以位于云端,从而,本专利技术实施例提供的问答处理方法也可以由该服务器来执行。
[0048]下面先对该模型的训练过程进行介绍,之后再介绍该模型的使用过程。
[0049]图2为本专利技术一实施例提供的模型训练方法的流程图,如图2所示,该模型训练方法包括如下步骤:
[0050]201、获取作为训练样本的第二问题语句和第二答复语句,第二问题语句和第二答复语句是一对问答语句。
[0051]202、通过第一输入层对第二问题语句进行词向量编码以得到多个第一词向量,以及通过第二输入层对第二答复语句进行词向量编码以得到多个第二词向量。
[0052]203、通过语句表示层提取多个第一词向量对应的第一语义表示向量,以及通过语句表示层提取多个第二词向量对应的第二语义表示向量。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答处理方法,其特征在于,包括:在第一时间接收到针对目标物品的第一问题语句;将所述第一问题语句输入到模型中,以通过所述模型获取与所述第一问题语句对应的属性;其中,所述模型从与所述目标物品关联的问答语句对中已经获取到所述属性以及属性值;获取与所述目标物品的所述属性对应的第一答复语句,所述第一答复语句中包括所述属性值;输出所述第一答复语句。2.根据权利要求1所述的方法,其特征在于,所述模型包括第一输入层、第二输入层、语句表示层、第一输出层和第二输出层;所述第一输入层和所述第二输入层分别与所述语句表示层连接;所述第一输出层和所述第二输出层分别与所述语句表示层连接。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取作为训练样本的第二问题语句和第二答复语句,所述第二问题语句和所述第二答复语句是一对问答语句;通过所述第一输入层对所述第二问题语句进行词向量编码以得到多个第一词向量,以及通过所述第二输入层对所述第二答复语句进行词向量编码以得到多个第二词向量;通过所述语句表示层提取所述多个第一词向量对应的第一语义表示向量,以及通过所述语句表示层提取所述多个第二词向量对应的第二语义表示向量;通过所述第一输出层对所述第一语义表示向量进行分类处理,以获得所述第二问题语句对应的属性分类结果,以及通过所述第二输出层对所述第二语义表示向量进行序列标注处理,以获得所述第二答复语句对应的属性值标注结果;根据所述属性分类结果确定第一损失函数,以及根据所述属性值标注结果确定第二损失函数;根据所述第一损失函数和所述第二损失函数的叠加结果调整所述模型的参数。4.根据权利要求3所述的方法,其特征在于,若存在与所述第二答复语句对应的多个问题语句,则所述第二问题语句为所述多个问题语句中的任一个。5.根据权利要求3所述的方法,其特征在于,若存在与所述第二问题语句对应的多个答复语句,则所述第二答复语句为所述多个答复语句的拼接结果。6.根据权利要求3所述的方法,其特征在于,所述方法还包括:在第二时间获取到与所述目标物品对应的第三问题语句和第三答复语句,所述第三问题语句和所述第三答复语句是一对问答语句,所述第二时间早于所述第一时间;通过所述模型获取与所述第三问题语句对应的所述属性,以及与所述第三答复语句对应的属性值;根据所述属性值生成与所述属性对应的所述第一答复语句。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:若在所述第二时间与所述第一时间之间还存在对应于所述属性的第四问题语句以及与所述第四问题语句对应的第四答复语句,则根据所述第四答复语句对应的属性值,更新所述第一答复语句,所述第四问题语句对应的属性以及所述第四答复语句对应的属性值通
过所述模型获取。8.根据...

【专利技术属性】
技术研发人员:田俊峰王睿
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1