【技术实现步骤摘要】
智能语音随访方法、系统、计算机设备、存储介质及程序产品
本专利技术涉及意图识别的
,更具体地,特别是指一种通过意图识别而减少数据失真的智能语音随访方法、系统、计算机设备、存储介质及程序产品。
技术介绍
在医疗领域中,病人手术后的身体情况指标,对医院满意度打分,通知体检等内容,以往都需要人工拨打患者的电话进行信息收集,但是每个人的精力都是有限的,并且也会因为个人情绪等原因影响患者体验。现在智能随访系统就能很好的解决这个问题,将患者的电话信息导入智能随访系统,通过话术脚本的制作,在ASR和NLP两项技术的支持下,就能很好地实现机器与患者的对话,并在对话中收集想要知道的患者问题回答。目前大多智能随访系统采用关键词检索的方式来进行患者的意图识别,进而判断询问患者的问题的回答是否已经收集成功。但是当患者的意图很难用几个关键词进行编写,又或者未在历史数据中出现过,那么此时的患者意图是识别不了的,这也将会导致未收集到患者的有效信息,产生数据失真。也有一部分智能随访系统会采用文本相似度匹配的方法来进行患者的意图识别,但 ...
【技术保护点】
1.一种智能语音随访方法,其特征在于,包括以下步骤:/n步骤1、构建与预设问题的答案类别相关的关键词词典;/n步骤2、收集随访对象针对所述预设问题的回答的语音数据并将所述语音数据转化成文本数据;以及/n步骤3、遍历所述关键词词典,判断所述文本数据中是否包含所述关键词词典中的关键词,如果包含,则记录所述回答所属的答案类别并根据第一预设话术脚本继续进行问答,如果不包含,则通过文本相似度计算确定所述文本数据的意图类别,记录所述意图类别对应的答案类别并根据第二预设话术脚本继续进行问答,其中所述第一预设话术脚本与所述第二预设话术脚本相同或者不同。/n
【技术特征摘要】
1.一种智能语音随访方法,其特征在于,包括以下步骤:
步骤1、构建与预设问题的答案类别相关的关键词词典;
步骤2、收集随访对象针对所述预设问题的回答的语音数据并将所述语音数据转化成文本数据;以及
步骤3、遍历所述关键词词典,判断所述文本数据中是否包含所述关键词词典中的关键词,如果包含,则记录所述回答所属的答案类别并根据第一预设话术脚本继续进行问答,如果不包含,则通过文本相似度计算确定所述文本数据的意图类别,记录所述意图类别对应的答案类别并根据第二预设话术脚本继续进行问答,其中所述第一预设话术脚本与所述第二预设话术脚本相同或者不同。
2.根据权利要求1所述的智能语音随访方法,其特征在于,所述步骤1进一步包括:
步骤11、获取针对所述预设问题的第一组历史回答的第一历史语音数据集并将所述第一历史语音数据集转化成第一历史文本数据集;
步骤12、对所述第一历史文本数据集中的每个历史回答所属的答案类别进行标注;
步骤13、对每个答案类别的文本进行分词处理,去掉停用词后得到多个分词,计算每个分词在所述第一历史文本数据集中的词频和逆文档频率并将所述词频和所述逆文档频率相乘得到相应分词在所述第一历史文本数据集中出现的概率,按照所述概率从大到小对每个答案类别中的分词进行排序,将高于预设阈值的概率对应的分词作为基础词,在所述基础词上进行扩写得到扩写关键词;以及
步骤14、利用步骤12标注的所述第一历史文本数据集验证所述扩写关键词后构建所述关键词词典。
3.根据权利要求2所述的智能语音随访方法,其特征在于,通过文本相似度计算确定所述文本数据的意图类别进一步包括:
将未包含所述关键词词典中的关键词的所述文本数据输入到文本相似度识别模型中进行文本相似度计算,输出相似度最高的意图类别。
4.根据权利要求3所述的智能语音随访方法,其特征在于,根据第二预设话术脚本继...
【专利技术属性】
技术研发人员:张静玮,苏钰,罗志轩,张杨倩倩,牛博也,
申请(专利权)人:北京源和汇升科技中心有限合伙,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。