一种文本应答的方法和装置制造方法及图纸

技术编号:39323063 阅读:10 留言:0更新日期:2023-11-12 16:02
本发明专利技术公开了一种文本应答的方法和装置,涉及计算机技术领域。文本应答的方法的一具体实施方式包括:响应于接收到目标文本,获取目标文本对应的候选属性,确定目标文本与候选属性对应的相似度向量;对目标文本和候选属性进行编码,得到语义向量,根据预先设置的注意力机制对语义向量进行加权,得到加权语义向量;对候选属性进行图谱构建,得到图嵌入向量;对相似度向量、加权语义向量和图嵌入向量进行拼接,得到拼接向量,对拼接向量进行映射转换,得到候选属性与目标文本的匹配度,根据匹配度对候选属性进行排序,得到属性排序结果;根据属性排序结果生成目标文本的应答文本。该实施方式能够输出更准确的应答文本,提高用户使用体验。验。验。

【技术实现步骤摘要】
一种文本应答的方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种文本应答的方法和装置。

技术介绍

[0002]随着人工智能的发展,知识库对话系统在日常生活中的应用范围越来越广,例如,在商品选购过程中,用户通过知识库对话系统了解商品详情,在金融理财过程中,用户通过知识库对话系统了解理财产品详情。知识库对话系统用于快速应答用户提出的常见问题。在应答问题时,现有技术通常是基于语义解析的方法或者信息检索的方法获取问题的答案。
[0003]在实现本专利技术的过程中,专利技术人发现现有技术至少存在如下问题:
[0004]用户提出的问题通常包含大量口语化表达,与标准商品属性描述之间存在差距,使用常规的文本匹配模型得到的语义表征效果较差,导致文本应答不准确。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种文本应答的方法和装置,能够输出更准确的应答文本,提高用户使用体验。
[0006]为实现上述目的,根据本专利技术实施例的第一方面,提供一种文本应答的方法,包括:
[0007]响应于接收到目标文本,获取所述目标文本对应的候选属性,确定所述目标文本与所述候选属性对应的相似度向量;
[0008]对所述目标文本和所述候选属性进行编码,得到语义向量,根据预先设置的注意力机制对所述语义向量进行加权,得到加权语义向量;
[0009]对所述候选属性进行图谱构建,得到所述候选属性对应的图嵌入向量;
[0010]对所述相似度向量、所述加权语义向量和所述图嵌入向量进行拼接,得到拼接向量,对所述拼接向量进行映射转换,得到所述候选属性与所述目标文本的匹配度,根据所述匹配度对所述候选属性进行排序,得到属性排序结果;
[0011]根据所述属性排序结果生成所述目标文本的应答文本。
[0012]可选地,在对所述相似度向量、所述加权语义向量和所述图嵌入向量进行拼接之前,所述方法还包括:
[0013]根据所述加权语义向量和所述图嵌入向量确定对应的注意力权重;
[0014]根据所述注意力权重对所述图嵌入向量进行增强,得到增强图嵌入向量,将所述增强图嵌入向量作为用于拼接的图嵌入向量。
[0015]可选地,对所述候选属性进行图谱构建,得到所述候选属性对应的图嵌入向量,包括:
[0016]将所述候选属性转换为候选属性图;
[0017]确定所述候选属性图包括的候选属性节点,根据所述候选属性节点对应的邻居节
点的节点特征,对所述候选属性节点的节点特征进行更新;
[0018]对更新节点特征后的候选属性节点和不同候选属性节点之间的节点关系进行映射,得到所述候选属性对应的图嵌入向量。
[0019]可选地,在对所述候选属性进行图谱构建之前,所述方法还包括:
[0020]获取第一历史文本,生成所述第一历史文本对应的数据三元组;
[0021]使用所述数据三元组对预先设置的卷积神经网络和图嵌入模型进行训练,得到图谱模型,所述图谱模型用于对所述候选属性进行图谱构建。
[0022]可选地,在对所述目标文本和所述候选属性进行编码之前,所述方法还包括:
[0023]获取第二历史文本,向所述第二历史文本叠加文本标签,得到第一预处理文本;
[0024]根据所述第二历史文本的生成顺序对所述第一预处理文本进行拼接,得到第二预处理文本;
[0025]使用所述第二预处理文本对预先设置的预训练模型进行训练,得到语言模型,所述语言模型用于对所述目标文本和所述候选属性进行编码。
[0026]可选地,在使用所述第二预处理文本对预先设置的预训练模型进行训练之前,所述方法还包括:
[0027]根据所述第二历史文本的生成顺序生成对应的位置向量;
[0028]将所述位置向量叠加至所述第二预处理文本。
[0029]可选地,向所述第二历史文本叠加文本标签,包括:
[0030]根据所述第二历史文本关联的身份信息生成对应的文本标签,将所述文本标签叠加至所述第二历史文本。
[0031]可选地,所述第二历史文本包括超链接;向所述第二历史文本叠加文本标签,包括:
[0032]根据所述超链接生成对应的文本标签,将所述文本标签叠加至所述第二历史文本。
[0033]可选地,所述方法还包括:
[0034]确定所述超链接对应的链接文本;
[0035]生成所述链接文本对应的摘要文本,使用所述摘要文本替换所述第二历史文本中对应的超链接。
[0036]可选地,在接收到目标文本之前,所述方法还包括:
[0037]获取第三历史文本,将所述第三历史文本作为正样本;
[0038]根据预先设置的正负样本比例,生成所述正样本对应的负样本;
[0039]使用所述正样本和所述负样本对预先设置的神经网络进行训练,所述神经网络包括:图谱模型和语言模型。
[0040]可选地,生成所述正样本对应的负样本,包括:
[0041]对所述第三历史文本包括的训练文本和训练属性进行重组,得到候选负样本;
[0042]确定每个候选负样本包括的训练文本和训练属性的相似度;
[0043]在所述相似度大于等于预先设置的相似度阈值的情况下,将对应的候选负样本作为难负样本,在所述相似度小于所述相似度阈值的情况下,将对应的候选负样本作为易负样本;
[0044]根据预先设置的难易负样本比例,对所述难负样本和所述易负样本进行筛选,得到所述正样本对应的负样本。
[0045]可选地,在获取所述目标文本对应的候选属性之前,所述方法还包括:
[0046]判断预先设置的应答文本集是否存储有所述目标文本,在预先设置的应答文本集存储有所述目标文本的情况下,从所述应答文本集中获取所述目标文本对应的应答文本。
[0047]可选地,在根据所述属性排序结果生成所述目标文本的应答文本之后,所述方法还包括:
[0048]将所述目标文本和所述应答文本关联存储至所述应答文本集。
[0049]根据本专利技术实施例的第二方面,提供一种文本应答的装置,包括:
[0050]相似度模块,用于响应于接收到目标文本,获取所述目标文本对应的候选属性,确定所述目标文本与所述候选属性对应的相似度向量;
[0051]语义模块,用于对所述目标文本和所述候选属性进行编码,得到语义向量,根据预先设置的注意力机制对所述语义向量进行加权,得到加权语义向量;
[0052]图嵌入模块,用于对所述候选属性进行图谱构建,得到所述候选属性对应的图嵌入向量;
[0053]排序模块,用于对所述相似度向量、所述加权语义向量和所述图嵌入向量进行拼接,得到拼接向量,对所述拼接向量进行映射转换,得到所述候选属性与所述目标文本的匹配度,根据所述匹配度对所述候选属性进行排序;
[0054]应答模块,用于根据所述属性排序结果生成所述目标文本的应答文本。
[0055]可选地,所述装置还包括:
...

【技术保护点】

【技术特征摘要】
1.一种文本应答的方法,其特征在于,包括:响应于接收到目标文本,获取所述目标文本对应的候选属性,确定所述目标文本与所述候选属性对应的相似度向量;对所述目标文本和所述候选属性进行编码,得到语义向量,根据预先设置的注意力机制对所述语义向量进行加权,得到加权语义向量;对所述候选属性进行图谱构建,得到所述候选属性对应的图嵌入向量;对所述相似度向量、所述加权语义向量和所述图嵌入向量进行拼接,得到拼接向量,对所述拼接向量进行映射转换,得到所述候选属性与所述目标文本的匹配度,根据所述匹配度对所述候选属性进行排序,得到属性排序结果;根据所述属性排序结果生成所述目标文本的应答文本。2.根据权利要求1所述的方法,其特征在于,在对所述相似度向量、所述加权语义向量和所述图嵌入向量进行拼接之前,所述方法还包括:根据所述加权语义向量和所述图嵌入向量确定对应的注意力权重;根据所述注意力权重对所述图嵌入向量进行增强,得到增强图嵌入向量,将所述增强图嵌入向量作为用于拼接的图嵌入向量。3.根据权利要求1所述的方法,其特征在于,对所述候选属性进行图谱构建,得到所述候选属性对应的图嵌入向量,包括:将所述候选属性转换为候选属性图;确定所述候选属性图包括的候选属性节点,根据所述候选属性节点对应的邻居节点的节点特征,对所述候选属性节点的节点特征进行更新;对更新节点特征后的候选属性节点和不同候选属性节点之间的节点关系进行映射,得到所述候选属性对应的图嵌入向量。4.根据权利要求1所述的方法,其特征在于,在对所述候选属性进行图谱构建之前,所述方法还包括:获取第一历史文本,生成所述第一历史文本对应的数据三元组;使用所述数据三元组对预先设置的卷积神经网络和图嵌入模型进行训练,得到图谱模型,所述图谱模型用于对所述候选属性进行图谱构建。5.根据权利要求1所述的方法,其特征在于,在对所述目标文本和所述候选属性进行编码之前,所述方法还包括:获取第二历史文本,向所述第二历史文本叠加文本标签,得到第一预处理文本;根据所述第二历史文本的生成顺序对所述第一预处理文本进行拼接,得到第二预处理文本;使用所述第二预处理文本对预先设置的预训练模型进行训练,得到语言模型,所述语言模型用于对所述目标文本和所述候选属性进行编码。6.根据权利要求5所述的方法,其特征在于,在使用所述第二预处理文本对预先设置的预训练模型进行训练之前,所述方法还包括:根据所述第二历史文本的生成顺序生成对应的位置向量;将所述位置向量叠加至所述第二预处理文本。7.根据权利要求5所述的方法,其特征在于,向所述第二历史文本叠加文本标签,包括:
根据所述第二历史文本关联的身份信息生成对应的文本标签,将所述文本标签叠加至所述第二历史文本。8.根据权利要求5所述的方法,其特征在于,所述第二历史文本包括超链接;向所述第二历史文本叠加文本标签,包括:根据所述超链接生成对应的文本...

【专利技术属性】
技术研发人员:席泽西宋阳陈蒙
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1