语音回访问卷调查方法及系统、计算设备、存储介质技术方案

技术编号:37108517 阅读:26 留言:0更新日期:2023-04-01 05:07
本申请提供了一种语音回访问卷调查方法及系统、计算设备、存储介质,在本申请提供的方法中,先利用智能外呼设备拨打至少一被采访用户的联系电话;再通过语音向被采访用户提问问卷调查的多个问卷调查问题,并保存智能外呼设备和被采访用户之间的语音通话数据;然后对语音通话数据进行ASR识别并转换为文本通话数据;最后获取各问卷调查问题对应的预设答复文本,对预设答复文本和答复文本数据进行匹配,得出问卷调查的结果。基于本申请提供的语音回访问卷调查方法及系统、计算设备、存储介质,相对于已有的模型更加适配问卷文本匹配的灵活性,并且可以覆盖到90%的文本情况,同时质量效果相对于现有的模型也提高10%个点。效果相对于现有的模型也提高10%个点。效果相对于现有的模型也提高10%个点。

【技术实现步骤摘要】
语音回访问卷调查方法及系统、计算设备、存储介质


[0001]本申请涉及数据处理
,特别是涉及一种语音回访问卷调查方法及系统、计算设备、存储介质。

技术介绍

[0002]伴随着AI产品在我们生活中越来越普遍,例如谷歌翻译、百度翻译、百度小度、小米小爱、以及商场中的智能导航等等。机器回访问卷调查在企业中也越来越多的被应用,例如广东中医院的医疗问卷就是让机器自动拨打病人电话,对病人近期健康状态进行访问,可以追踪病人的病情记录以及采取更加措施治疗病人,也可以让医务人员从繁杂的人力劳动中脱离出来,节省效率。
[0003]问卷调查的任务可以划分为TTS(英文全称Text To Speech,将提前编写的文本转义为语音)、ASR(英文全称Automatic Speech Recognition,将语音转义为文本信息)、文本匹配。由于问卷调查方式的灵活性,使得文本匹配的任务难度提高几个数量级,变得非常棘手,难以解决。在NLP(英文全称Natural Language Processing,自然语言处理)领域,针对文本匹配任务大部分都是将文本进行向本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音回访问卷调查方法,包括:利用智能外呼设备拨打至少一被采访用户的联系电话;在所述智能外呼设备和所述被采访对象建立语音通话后,通过语音向所述被采访用户提问问卷调查的多个问卷调查问题,并保存所述智能外呼设备和所述被采访用户之间的语音通话数据;对所述语音通话数据进行ASR识别,以将所述语音通话数据转换为文本通话数据;所述文本通话数据包括对应各所述问卷调查问题的答复文本数据;获取各所述问卷调查问题对应的预设答复文本,对所述预设答复文本和所述答复文本数据进行匹配,得出所述问卷调查的结果。2.根据权利要求1所述的方法,其特征在于,所述获取各所述问卷调查问题对应的预设答复文本,对所述预设答复文本和所述答复文本数据进行匹配,得出所述问卷调查的结果,包括:对于每个所述问卷调查问题,对所述问卷调查问题对应的答复文本数据进行预处理,并按照字粒度进行分词并构建文本数据词库;利用TF

IDF将所述文本数据词库进行向量化得到第一向量;将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算,根据相似度计算结果确定所述问卷调查问题对应的结果;整合所述多个问卷调查问题对应的结果,得出所述问卷调查的结果。3.根据权利要求2所述的方法,其特征在于,所述将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算,根据相似度计算结果确定所述问卷调查问题对应的结果,包括:将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算,得到对应各所述预设答复文本的第一相似度得分;判断至少一所述第一相似度得分大于或等于第一预设阈值时,根据所述第一相似度得分确定所述问卷调查问题对应的结果并返回;判断所述第一相似度得分均小于所述第一预设阈值时,将所述答复文本数据转为拼音数据,利用Glove算法学习所述拼音数据得到所述问题对应的结果。4.根据权利要求3所述的方法,其特征在于,所述将所述答复文本数据转为拼音数据,利用Glove算法学习所述拼音数据得到所述问题对应的结果,包括:将所述答复文本数据转换为拼音数据,并按照空格分割所述拼音数据,构造共现矩阵;利用Glove算法基于所述共现矩阵学习所述拼音数据对应的第二向量;将所述第二向量分别与所述问题对应的多个预设答复文本进行相似度计算,得到对应各所述预设答复文本的第二相似度得分;判断至少一所述第二相似度得分大于或等于第二预设阈值时,根据所述第二相似度得分确定所述问卷调查问题对应的结果并返回;判断所述第二相似度得分均小于所述第二预设阈值时,将所述答复文本数据输入实体识别模型,利用所述实体识别模型得出所述问题对应的结果。5.根据权利要求4所述的方法,其特征在于,所述将所述答复文本数据输入实体识别模型,利用所述实体识别模型得出所述问题对应的结果,包括:
将所述答复文本数据输入预先训练好的实体识别模型,利用所述实体识别模型挖掘出至少一个实体知识点;所述实体知识点的类型包括但不限于时间副词、频度副词、情感极性词、实体名词、...

【专利技术属性】
技术研发人员:段兴涛赵国庆蒋宁
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1