【技术实现步骤摘要】
信息差异的识别方法和存储介质、电子设备
[0001]本公开涉及信息抓取
,尤其是一种信息差异的识别方法和存储介质、电子设备。
技术介绍
[0002]信息抓取是企业信息化的根基和第一步,只有利用先进的技术作好了信息抓取工作,才能为信息化带来最大的价值;在房产领域中,楼盘知识是已有房产信息的一种保存形式;因为房产信息会随时间变化,所以需要存量信息更新、增量信息获取和信息验证的环节,例如,从经纪人对话信息中获得房产相关信息;当获取的多个针对同一房产进行描述的信息不同时,为避免信息错误,需要通过人工分析确定确定哪些信息可以获取,无法实现信息的自动识别和获取。
技术实现思路
[0003]为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种信息差异的识别方法和存储介质、电子设备。
[0004]根据本公开实施例的一个方面,提供了一种信息差异的识别方法,包括:
[0005]获得目标主体对应的问答数据;
[0006]对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值;
[0007]确定所述问答意图中目标问答意图对应的回答槽位值;
[0008]将所述回答槽位值与所述目标问答意图对应的标准槽位值进行匹配,确定所述问答槽位值与所述标准槽位值之间的差异。
[0009]可选地,所述问答数据为问答文本;
[0010]所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:
[0011] ...
【技术保护点】
【技术特征摘要】
1.一种信息差异的识别方法,其特征在于,包括:获得目标主体对应的问答数据;对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值;确定所述问答意图中目标问答意图对应的回答槽位值;将所述回答槽位值与所述目标问答意图对应的标准槽位值进行匹配,确定所述问答槽位值与所述标准槽位值之间的差异。2.根据权利要求1所述的方法,其特征在于,所述问答数据为问答文本;所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:对所述问答文本执行分词操作,得到至少一个文本词;基于所述至少一个文本词得到所述问答文本的文本特征;利用编码器对所述文本特征进行处理得到意图嵌入和槽位值嵌入;利用第一解码器对所述意图嵌入进行处理,得到所述问答数据对应的问答意图;利用第二解码器对所述槽位值嵌入进行处理,得到所述问答数据对应的回答槽位值。3.根据权利要求2所述的方法,其特征在于,所述利用编码器对所述文本特征进行处理得到意图嵌入和槽位值嵌入,包括:基于所述编码器的第一网络分支对所述文本特征进行处理,得到第一意图特征、第二意图特征和第三意图特征;基于所述编码器的第二网络分支对所述文本特征进行处理,得到第一槽位特征、第二槽位特征和第三槽位特征;对所述第一意图特征与所述第一槽位特征执行融合处理,得到第一融合特征;对所述第二意图特征与所述第二槽位特征执行融合处理,得到第二融合特征;将所述第一融合特征的转置与所述第二融合特征执行矩阵相乘和归一化处理,得到权重特征;基于所述权重特征与所述第三意图特征执行矩阵相乘,得到所述意图嵌入;基于所述权重特征与所述第三槽位特征执行矩阵相乘,得到所述槽位值嵌入。4.根据权利要求1
‑
3任一所述的方法,其特征在于,所述问答数据为问答语音;所述对所述问答数据进行意图识别和槽位值识别,得到所述问答数据对应的问答意图和回答槽位值,包括:对所述问答语音执行切分操作,得到至少一个语音片段;基于所述至少一个语音片段得到所述问答语音的语音特征;利用编码器对所述语音特征进行处理得到意图嵌入和槽位值嵌入;利用第一解码器对所述意图嵌入进行处理,得到所述问答数据对应的问答意图;利用第二解码器对所述槽位值嵌入进行处理,得到所述问答数据对应的回答槽位值。5.根据权利要求4所述的方法,其特征在于,所述利用编码器对所述语音特征进行处理得到意图嵌入和槽位值嵌入,包括:基于所述编码器的第一网络分支对所述语音特征进行处理,得到第一意图特征、第二意图特征和第三意图特征;
基于所述编码器的第二网络分支对所述语音特征进行处理,得到第一槽位特征、第二槽位特征和第三槽位特征;对所述第一意图特征与所述第一槽位特征执行融合处理,得到第一融合特征;对所述第二意图特征与所述第二槽位特征执行融合处理,得到第二融合特征;将所述第一融合特征...
【专利技术属性】
技术研发人员:郝梦圆,柴鹰,王奇文,
申请(专利权)人:北京房江湖科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。