【技术实现步骤摘要】
基于语音交互的信息核实方法、装置、设备和计算机存储介质
本申请涉及计算机
,特别涉及人工智能
技术介绍
在地图类应用中,地理位置点可以是地图上的POI(PointOfInterest,兴趣点)、AOI(AreaOfInterest,兴趣区域)或者更大范围的ROI(RegionOfInterest,位置区域),尤其是与人们生活密切相关的地点,如学校、银行、餐馆、医院、超市等。一个地理位置往往包括:名称、坐标、地址、类别和电话等信息。地理位置信息通常由实地采集、互联网数据获取和用户上报等方式获取。由于城市建设快速发展和业务单位规划的变更,导致地理位置信息也会频繁地发生变化。地理位置点检索和地图导航等应用均以地理位置点信息为数据基础,所以地理位置点数据的准确性对于各类地图应用的准确性和可用性至关重要。地图类应用为了提升地理位置点数据的准确性,需要对现存的地理位置点信息进行核实。
技术实现思路
有鉴于此,本申请提供了一种基于语音交互的信息核实方法、装置、设备和计算机存储介质。第一方 ...
【技术保护点】
1.一种基于语音交互的信息核实方法,包括:/n获取用户针对语音问询反馈的语音应答文本,所述语音问询用于向用户进行信息核实;/n将所述语音应答文本的各字符以及各字符对应的注音信息输入预先训练得到的语义理解模型,获取所述语义理解模型输出的用户意图信息和/或被核实对象信息,其中所述用户意图信息包括确认、否认、回答或提问。/n
【技术特征摘要】
1.一种基于语音交互的信息核实方法,包括:
获取用户针对语音问询反馈的语音应答文本,所述语音问询用于向用户进行信息核实;
将所述语音应答文本的各字符以及各字符对应的注音信息输入预先训练得到的语义理解模型,获取所述语义理解模型输出的用户意图信息和/或被核实对象信息,其中所述用户意图信息包括确认、否认、回答或提问。
2.根据权利要求1所述的方法,其中,所述注音信息包括汉语拼音。
3.根据权利要求1所述的方法,其中,所述语义理解模型包括:嵌入层和时序建模层,还包括映射层和/或预测层;
所述嵌入层,用于对所述各字符以及各字符对应的注音信息进行编码;
所述时序建模层,用于利用所述嵌入层对应的编码结果,学习所述各字符之间的语义依赖关系;
所述映射层,用于利用所述时序建模层所输出隐向量的最大池化结果,映射得到用户意图信息;
所述预测层,用于利用所述时序建模层输出的各时序的隐向量进行被核实对象信息预测。
4.根据权利要求1所述的方法,还包括:
若获取到所述被核实对象信息,则将所述被核实对象信息链指到所述被核实对象所属领域知识库中的对象信息。
5.根据权利要求4所述的方法,其中,将所述被核实对象信息链指到所述被核实对象所属领域知识库中的对象信息包括:
基于语音相似度、文本相似度和属性相似度中的至少一种,将所述被核实对象信息分类至所述领域知识库,以确定所述被核实对象链指到所述领域知识库中的对象信息;
如果确定出链指到的对象信息,则利用确定出的对象信息更新所述被核实对象信息。
6.根据权利要求1所述的方法,其中,所述获取用户针对语音问询反馈的语音应答文本包括:
利用声学模型和语言模型,对用户针对语音问询反馈的语音应答进行语音识别,得到所述语音应答文本;
其中所述声学模型和语言模型在训练过程中引入所述被核实对象所属对象类型的词典数据。
7.根据权利要求6所述的方法,其中,所述声学模型采用如下方式预先训练得到:
利用人工客服向用户进行信息核实的语音以及对应的标注文本,获得训练数据;
利用所述训练数据,对已有的声学模型进行模型参数的优化,其中将已有的声学模型的学习率调低。
8.根据权利要求1所述的方法,还包括:
基于多轮对话机制,向用户确认所述被核实对象信息的正确性。
9.根据权利要求8所述的方法,其中,所述基于多轮对话机制,向用户确认所述被核实对象信息的正确性包括:
向所述用户发出针对所述被核实对象信息中所包含字符信息的语音问询;
根据所述用户反馈的语音应答文本的用户意图信息,确定所述被核实对象信息的正确性。
10.根据权利要求1所述的方法,还包括:
将所述用户意图信息和/或所述被核实对象信息与已明确结果进行比对,如果一致,则确定所述用户通过测谎;否则确定所述用户未通过测谎;
对于未通过测谎的用户反馈的语音应答文本不予以采纳。
11.根据权利要求1所述的方法,还包括:
对所述用户针对语音问询反馈的语音应答进行情感识别、用户属性识别以及对当前时空信息进行识别中的至少一种;
依据识别结果,采用对应的话术与所述用户进行后续语音交互。
12.根据权利要求1所述的方法,还包括:利用语音合成模型产生所述语音问询;
所述语音合成模型采用人工客服向用户进行信息核实的语音以及对应的标注文本预先训练得到,所述标注文本包括对被核实对象所属对象类型的属性信息标注和/或时间信息。
13.根据权利要求1至12中任一项所述的方法,所述被核实对象信息包括地理位置点信息。
14.一种训练语义理解模型的方法,包括:
获取训练数据,所述训练数据包括用户针对语音问询反馈的语音应答文本,对所述语音应答文本的用户意图信息和/或被核实对象信息的标注;
将训练数据中语义应答文本的各字符以及各字符对应的注音信息作为语音理解模型的输入,标注的用户意图信息和/或被核实对象信息作为所述语义理解模型的目标输出,训练所述语义理解模型;其中所述用户意图信息包括确认、否认、回答或提问。
15.根据权利要求14所述的方法,其中,所述获取训练数据包括:
针对相同的语音问询,获取高频的语音应答文本并进行人工标注后,得到种子样本;
利用种子样本对历史数据库中经过对象信息泛化的语音应答文本进行相似度聚类;
依据聚类结果获取各用户意图信息对应的语音应答文本作为训练数据。
16.根据权利要求14所述的方法,其中,所述语义理解模型包括:嵌入层和时序建模层,还包括映射层和/或预测层;
所述嵌入层,用于对所述各字符以及各字符对应的注音信息进行编码;
所述时序建模层,用于利用所述嵌入层对应的编码结果,学习所述各字符之间的语义依赖关系;
所述映射层,用于利用所述时序建模层所输出隐向量的最大池化结果,映射得到用户意图信息;
所述预测层,用于利用所述时序建模层输出的各...
【专利技术属性】
技术研发人员:黄际洲,王海峰,时迎超,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。