一种人工智能语音外呼方法、系统及存储介质技术方案

技术编号：23852184 阅读：15 留言：0更新日期：2020-04-18 09:13

本发明专利技术公开一种人工智能语音外呼方法、系统及存储介质，本发明专利技术可替代人工坐席进行外呼工作，可进行语音识别纠错，纠正错误的语音识别结果，提高意图识别准确率；可进行用户性别、情绪、年龄段识别并进行个性化回复，提升用户感知；意图理解模块采用基于相似度计算和深度学习算法的融合模型，用户无需过多配置，即可正确识别意图。本发明专利技术可进行多轮对话，有时用户的问题无法通过一轮对话完成，利用对话状态追踪技术记录对话中的信息，结合槽位填充机制，使系统引导用户更精确快捷的完成对话。本发明专利技术的系统根据交互信息，包括客户性别、情绪、年龄、用户回答、交互轮次等信息，对客户进行用户画像分析，精确定位客户类型。

An artificial intelligence voice call method, system and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种人工智能语音外呼方法、系统及存储介质
本专利技术涉及人工智能
，尤其涉及一种人工智能语音外呼方法、系统及存储介质。
技术介绍
当前，电话仍然是主流的客服沟通渠道。比如在快递送货电话提醒，客户信息提醒，金融还款催收，主动营销，潜在客户筛选等方向，而传统客服行业存在着用人成本高，行业变化快，人工情绪不稳定，人员流动大，场地租金高等缺点。随着技术的发展，人工智能技术也逐渐走进客服领域，但目前的智能客服系统在意图识别中使用关键词模型，存在着语音识别率低，另外在识别模型中需人工配置大量词库，交互流程只能根据系统中预设的程序和数据进行机械的单轮问答式交流，无法结合上下文进行多轮交互，无法根据客户情绪，性别，年龄段等重要特征为客户进行个性化服务，影响服务效果。基于此，现急需一种人工智能语音外呼方法、系统及存储介质，以期对上述现有技术缺陷进行改善。上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供了人工智能语音外呼方法、系统及存储介质，旨在解决现有技术存在语音对话机械单一、服务效果差且无法有效的为不同的客户提供个性化服务的技术缺陷。为实现上述目的，本专利技术提供了一种人工智能语音外呼方法，所述方法包括：S1、用户设置外呼任务，获取外呼时间段、外呼业务和外呼数据源；S2、从上述外呼信息中获取外呼号码，通过运营商语音中继拨通客户的号码并将话务分配到空闲的SIP终端；S3、SIP终端将...

【技术保护点】
1.一种人工智能语音外呼方法，其特征在于，所述方法包括：/nS1、用户设置外呼任务，获取外呼时间段、外呼业务和外呼数据源；/nS2、从上述外呼信息中获取外呼号码，通过运营商语音中继拨通客户的号码并将话务分配到空闲的SIP终端；/nS3、SIP终端将获取的客户语音媒体数据传送至语音增强识别模块，该模块首先对客户语音媒体数据中的音频特征进行提取处理，将提取出的音频特征进行语音转文字识别，同时利用深度学习和决策树算法开发的语音特征识别模型对该客户的性别、情绪、年龄段进行识别，然后将识别结果以特定格式发入到消息队列中；/nS4、自然语言处理模块从S3的消息队列中取出语音特征识别模型识别的结果，通过纠错算法对将上述识别的结果中的近音词、乱序错误进行纠错，然后再意图识别、命名实体识别、句法分析的基础上通过相似度计算和深度学习算法的融合模型对文本进行深度的语义分析，将分析结果以特定格式发入到消息队列中；/nS5、流程控制模块从S4的消息队列中取出自然语言处理消息和语音增强识别消息，根据意图处理结果、用户性别、年龄、情绪和预先配置的业务流程，选择合适的回复流程，然后将该流程ID发入消息队列；若无合适流...

【技术特征摘要】
1.一种人工智能语音外呼方法，其特征在于，所述方法包括：
S1、用户设置外呼任务，获取外呼时间段、外呼业务和外呼数据源；
S2、从上述外呼信息中获取外呼号码，通过运营商语音中继拨通客户的号码并将话务分配到空闲的SIP终端；
S3、SIP终端将获取的客户语音媒体数据传送至语音增强识别模块，该模块首先对客户语音媒体数据中的音频特征进行提取处理，将提取出的音频特征进行语音转文字识别，同时利用深度学习和决策树算法开发的语音特征识别模型对该客户的性别、情绪、年龄段进行识别，然后将识别结果以特定格式发入到消息队列中；
S4、自然语言处理模块从S3的消息队列中取出语音特征识别模型识别的结果，通过纠错算法对将上述识别的结果中的近音词、乱序错误进行纠错，然后再意图识别、命名实体识别、句法分析的基础上通过相似度计算和深度学习算法的融合模型对文本进行深度的语义分析，将分析结果以特定格式发入到消息队列中；
S5、流程控制模块从S4的消息队列中取出自然语言处理消息和语音增强识别消息，根据意图处理结果、用户性别、年龄、情绪和预先配置的业务流程，选择合适的回复流程，然后将该流程ID发入消息队列；若无合适流程，则调用自然语言生成模块，从知识库中抽取重生成合适的回复内容，并将回复内容发入消息队列；若需要进行短信或微信发送，则会发送短信，微信发送消息至消息队列；
S6、语音播报模块从S5的消息队列中取出流程ID消息，根据流程ID播报相关语音，若S5发送自然语言生成消息，则调用语音合成模块合成对应的语音；语音经过运营商中继发送到客户终端，完成一轮交互流程；
S7、交互过程中当客户打断机器人说话时，SIP终端恢复至指定节点；
S8、若有短信，微信发送消息，则短信/微信发送模块会读取该消息，调用指定短信/微信内容，通过短信/微信接口将短信/微信发送至客户；
S9、当客户听完回答后，提出新的问题，则系统重复上述S3-S6过程；
S10、当客户挂机或系统走完该业务的流程后，系统结束流程，并将整个交互过程存入日志系统，客户分类模块根据全程交互信息，结合前期积累的大量用户交互信息，对客户进行用户画像分类，为下一步跟进提供有效信息。

2.如权利要求1所述的人工智能语音外呼方法，其特征在于，所述S3中的语音增强识别模块包括语音识别模型以及增强识别、语音特征识别模型；
所述语音识别模型将语音转换为文字，然后将文字内容传给自然语言处理模块进行处理；
所述增强识别、语音特征识别模型对输入语音进行性别、情绪、年龄识别，识别结果通过系统可识别的代码发送到消息队列,该增强识别结果用于流程模块根据不同的性别、年龄、情绪参数走不同的业务流程。

3.如权利要求2所述的人工智能语音外呼方法，其特征在于，所述增强识别、语音特征识别模型包括深度学习卷积神经网络和决策树算法；
其中，深度学习卷积神经网络为7层模型，输入层为8*1024的音频数据矩阵，经过两层卷积和池化，最终输出1*22维的音频特征矩阵，最后将该音频特...

【专利技术属性】
技术研发人员：周瑞，
申请(专利权)人：北京智乐瑟维科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人