信息差异的识别方法和存储介质、电子设备技术

技术编号:32341633 阅读:16 留言:0更新日期:2022-02-16 18:51
本公开实施例公开了一种信息差异的识别方法和存储介质、电子设备,其中,方法包括:获得目标主体对应的问答数据;对问答数据进行意图识别和槽位值识别,得到问答数据对应的问答意图和回答槽位值;确定问答意图中目标问答意图对应的回答槽位值;将回答槽位值与目标问答意图对应的标准槽位值进行匹配,确定问答槽位值与标准槽位值之间的差异;本实施例通过提取多组问答数据中的问答意图和回答槽位值,实现回答槽位值与标准槽位值之间的相互印证,提高了获取的槽位值信息的可信度,基于可信度对槽位值进行数据获取,实现了自动数据获取,提高了数据获取的效率。了数据获取的效率。了数据获取的效率。

【技术实现步骤摘要】
信息差异的识别方法和存储介质、电子设备


[0001]本公开涉及信息抓取
,尤其是一种信息差异的识别方法和存储介质、电子设备。

技术介绍

[0002]信息抓取是企业信息化的根基和第一步,只有利用先进的技术作好了信息抓取工作,才能为信息化带来最大的价值;在房产领域中,楼盘知识是已有房产信息的一种保存形式;因为房产信息会随时间变化,所以需要存量信息更新、增量信息获取和信息验证的环节,例如,从经纪人对话信息中获得房产相关信息;当获取的多个针对同一房产进行描述的信息不同时,为避免信息错误,需要通过人工分析确定确定哪些信息可以获取,无法实现信息的自动识别和获取。

技术实现思路

[0003]为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种信息差异的识别方法和存储介质、电子设备。
[0004]根据本公开实施例的一个方面,提供了一种信息差异的识别方法,包括:
[0005]获得目标主体对应的问答数据;
[0006]对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值;
[0007]确定所述问答意图中目标问答意图对应的回答槽位值;
[0008]将所述回答槽位值与所述目标问答意图对应的标准槽位值进行匹配,确定所述问答槽位值与所述标准槽位值之间的差异。
[0009]可选地,所述问答数据为问答文本;
[0010]所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:
[0011]对所述问答文本执行分词操作,得到至少一个文本词;
[0012]基于所述至少一个文本词得到所述问答文本的文本特征;
[0013]利用编码器对所述文本特征进行处理得到意图嵌入和槽位值嵌入;
[0014]利用第一解码器对所述意图嵌入进行处理,得到所述问答数据对应的问答意图;利用第二解码器对所述槽位值嵌入进行处理,得到所述问答数据对应的回答槽位值。
[0015]可选地,所述利用编码器对所述文本特征进行处理得到意图嵌入和槽位值嵌入,包括:
[0016]基于所述编码器的第一网络分支对所述文本特征进行处理,得到第一意图特征、第二意图特征和第三意图特征;
[0017]基于所述编码器的第二网络分支对所述文本特征进行处理,得到第一槽位特征、第二槽位特征和第三槽位特征;
[0018]对所述第一意图特征与所述第一槽位特征执行融合处理,得到第一融合特征;
[0019]对所述第二意图特征与所述第二槽位特征执行融合处理,得到第二融合特征;
[0020]将所述第一融合特征的转置与所述第二融合特征执行矩阵相乘和归一化处理,得到权重特征;
[0021]基于所述权重特征与所述第三意图特征执行矩阵相乘,得到所述意图嵌入;
[0022]基于所述权重特征与所述第三槽位特征执行矩阵相乘,得到所述槽位值嵌入。
[0023]可选地,所述问答数据为问答语音;
[0024]所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:
[0025]对所述问答语音执行切分操作,得到至少一个语音片段;
[0026]基于所述至少一个语音片段得到所述问答语音的语音特征;
[0027]利用编码器对所述语音特征进行处理得到意图嵌入和槽位值嵌入;
[0028]利用第一解码器对所述意图嵌入进行处理,得到所述问答数据对应的问答意图;利用第二解码器对所述槽位值嵌入进行处理,得到所述问答数据对应的回答槽位值。
[0029]可选地,所述利用编码器对所述语音特征进行处理得到意图嵌入和槽位值嵌入,包括:
[0030]基于所述编码器的第一网络分支对所述语音特征进行处理,得到第一意图特征、第二意图特征和第三意图特征;
[0031]基于所述编码器的第二网络分支对所述语音特征进行处理,得到第一槽位特征、第二槽位特征和第三槽位特征;
[0032]对所述第一意图特征与所述第一槽位特征执行融合处理,得到第一融合特征;
[0033]对所述第二意图特征与所述第二槽位特征执行融合处理,得到第二融合特征;
[0034]将所述第一融合特征的转置与所述第二融合特征执行矩阵相乘和归一化处理,得到权重特征;
[0035]基于所述权重特征与所述第三意图特征执行矩阵相乘,得到所述意图嵌入;
[0036]基于所述权重特征与所述第三槽位特征执行矩阵相乘,得到所述槽位值嵌入。
[0037]可选地,所述将所述回答槽位值与所述目标问答意图对应的标准槽位值进行匹配,确定所述问答槽位值与所述标准槽位值之间的差异,包括:
[0038]对所述回答槽位值进行筛选,确定与所述标准槽位值之间匹配的至少一个匹配槽位值;其中,所述标注槽位值为所述目标问答意图对应的历史问答数据对应的回答槽位值;
[0039]基于所述标准槽位值对应的第一分布和所述至少一个匹配槽位值对应的第二分布,确定所述至少一个匹配槽位值与所述标准槽位值之间的差异。
[0040]可选地,所述对所述回答槽位值进行筛选,确定与所述标准槽位值之间匹配的至少一个匹配槽位值,包括:
[0041]确定多个所述回答槽位值与所述标准槽位值之间的余弦相似度值;
[0042]确定多个所述回答槽位值与所述标准槽位值之间的最大公共子序列计算结果;
[0043]基于所述余弦相似度值和所述最大公共子序列计算结果,从多个所述回答槽位值中确定所述至少一个匹配槽位值。
[0044]可选地,所述基于所述标准槽位值对应的第一分布和所述至少一个匹配槽位值对
应的第二分布,确定所述至少一个匹配槽位值与所述标准槽位值之间的差异,包括:
[0045]确定所述标准槽位值对应的第一分布,确定所述至少一个匹配槽位值对应的第二分布;
[0046]利用相对熵确定所述第一分布与所述第二分布之间的相似度差异;
[0047]基于所述相似度差异确定所述至少一个匹配槽位值与所述标准槽位值之间的差异。
[0048]可选地,在确定所述问答意图中目标问答意图对应的回答槽位值之前,还包括:
[0049]确定所述问答数据对应的问答意图对应的槽位值类别;
[0050]基于所述问答数据对应的回答槽位值与所述槽位值类别之间的匹配关系,确定所述问答意图与所述回答槽位值是否匹配;
[0051]响应于所述问答意图与所述回答槽位值匹配,确定所述问答意图为有效问答意图。
[0052]根据本公开实施例的另一方面,提供了一种信息差异的识别装置,包括:
[0053]数据获取模块,用于获得目标主体对应的问答数据;
[0054]数据识别模块,用于对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值;
[0055]槽位值确定模块,用于确定所述问答意图中目标问答意图对应的回答槽位值;
[0056本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息差异的识别方法,其特征在于,包括:获得目标主体对应的问答数据;对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值;确定所述问答意图中目标问答意图对应的回答槽位值;将所述回答槽位值与所述目标问答意图对应的标准槽位值进行匹配,确定所述问答槽位值与所述标准槽位值之间的差异。2.根据权利要求1所述的方法,其特征在于,所述问答数据为问答文本;所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:对所述问答文本执行分词操作,得到至少一个文本词;基于所述至少一个文本词得到所述问答文本的文本特征;利用编码器对所述文本特征进行处理得到意图嵌入和槽位值嵌入;利用第一解码器对所述意图嵌入进行处理,得到所述问答数据对应的问答意图;利用第二解码器对所述槽位值嵌入进行处理,得到所述问答数据对应的回答槽位值。3.根据权利要求2所述的方法,其特征在于,所述利用编码器对所述文本特征进行处理得到意图嵌入和槽位值嵌入,包括:基于所述编码器的第一网络分支对所述文本特征进行处理,得到第一意图特征、第二意图特征和第三意图特征;基于所述编码器的第二网络分支对所述文本特征进行处理,得到第一槽位特征、第二槽位特征和第三槽位特征;对所述第一意图特征与所述第一槽位特征执行融合处理,得到第一融合特征;对所述第二意图特征与所述第二槽位特征执行融合处理,得到第二融合特征;将所述第一融合特征的转置与所述第二融合特征执行矩阵相乘和归一化处理,得到权重特征;基于所述权重特征与所述第三意图特征执行矩阵相乘,得到所述意图嵌入;基于所述权重特征与所述第三槽位特征执行矩阵相乘,得到所述槽位值嵌入。4.根据权利要求1

3任一所述的方法,其特征在于,所述问答数据为问答语音;所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:对所述问答语音执行切分操作,得到至少一个语音片段;基于所述至少一个语音片段得到所述问答语音的语音特征;利用编码器对所述语音特征进行处理得到意图嵌入和槽位值嵌入;利用第一解码器对所述意图嵌入进行处理,得到所述问答数据对应的问答意图;利用第二解码器对所述槽位值嵌入进行处理,得到所述问答数据对应的回答槽位值。5.根据权利要求4所述的方法,其特征在于,所述利用编码器对所述语音特征进行处理得到意图嵌入和槽位值嵌入,包括:基于所述编码器的第一网络分支对所述语音特征进行处理,得到第一意图特征、第二意图特征和第三意图特征;
基于所述编码器的第二网络分支对所述语音特征进行处理,得到第一槽位特征、第二槽位特征和第三槽位特征;对所述第一意图特征与所述第一槽位特征执行融合处理,得到第一融合特征;对所述第二意图特征与所述第二槽位特征执行融合处理,得到第二融合特征;将所述第一融合特征...

【专利技术属性】
技术研发人员:郝梦圆柴鹰王奇文
申请(专利权)人:北京房江湖科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1