一种语音检测方法、装置及设备制造方法及图纸

技术编号：17657231 阅读：30 留言：0更新日期：2018-04-08 09:47

本发明专利技术实施例公开了一种语音检测方法、装置及设备。该方法包括：依据语音会话样本确定设定身份用户的语音内容；将所述设定身份用户的语音内容转化成文本内容；依据预先训练得到的问题识别模型，确定所述文本内容是否包含异常问题，其中所述问题识别模型是依据问题文本内容训练得到的。本发明专利技术实施例提供的技术方案，实现了语音质量的自动检测，相比于现有的通过人工进行语音质量检测，提高了语音检测效率以及异常问题的检出率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音检测方法、装置及设备
本专利技术涉及语音处理
，尤其涉及一种语音检测方法、装置及设备。
技术介绍
公司的发展往往是靠业务拉动的，销售和客服积累了公司的众多业务信息，销售/客服和客户的沟通电话，汇集了众多的动态业务信息，对于公司来说，如果能从这些录音中挖掘有用的商业线索数据，对于公司把握市场，洞察先机，能够赢得客户，至关重要。电话销售是企业呼叫中心(CallCenter)的核心业务。规范化的服务对于呼叫质量的提升意义重大。目前，企业呼叫中心对电话销售质量的运营管理还停留在人工阶段，虽然配备质检人员进行抽检，但由于是随机抽样，且抽样比例非常低，使得问题电话的检出率极低。同时，由于需要人工测听确认，质检员的工作效率也不高。
技术实现思路
有鉴于此，本专利技术实施例提供一种语音检测方法、装置及设备，以提高语音内容中包含的异常问题的检出率以及语音检测效率。第一方面，本专利技术实施例提供了一种语音检测方法，包括：依据语音会话样本确定设定身份用户的语音内容；将所述设定身份用户的语音内容转化成文本内容；依据预先训练得到的问题识别模型，确定所述文本内容是否包含异常问题，其...
一种语音检测方法、装置及设备

【技术保护点】
一种语音检测方法，其特征在于，包括：依据语音会话样本确定设定身份用户的语音内容；将所述设定身份用户的语音内容转化成文本内容；依据预先训练得到的问题识别模型，确定所述文本内容是否包含异常问题，其中所述问题识别模型是依据问题文本内容训练得到的。

【技术特征摘要】
1.一种语音检测方法，其特征在于，包括：依据语音会话样本确定设定身份用户的语音内容；将所述设定身份用户的语音内容转化成文本内容；依据预先训练得到的问题识别模型，确定所述文本内容是否包含异常问题，其中所述问题识别模型是依据问题文本内容训练得到的。2.根据权利要求1所述的方法，其特征在于，依据预先训练得到的问题识别模型，确定所述文本内容是否包含异常问题，包括：依据所述问题识别模型中包含的问题词以及所述问题词的权重，确定所述文本内容的问题指数；若所述文本内容的问题指数大于问题指数阈值，则确定所述文本内容包含异常问题。3.根据权利要求1所述的方法，其特征在于，依据语音会话样本确定设定身份用户的语音内容，包括：确定所述语音会话样本中包含的不同用户的会话语句；将每一用户的会话语句翻译成会话文本，并基于预先训练得到的身份分类器，确定所述每一用户的身份；确定所述设定身份用户的语音内容。4.根据权利要求3所述的方法，其特征在于，确定语音会话样本中包含的不同用户的会话语句，包括：依据所述语音会话样本中会话语句对应的采集设备信息，确定不同用户的会话语句；或者，识别所述语音会话样本的声学特征，并依据识别结果，确定所述语音会话样本中包含的会话语句；依据所述语音会话样本中包含的会话语句的声学特征，对不同用户的语句进行聚类，依据聚类结果确定不同用户的会话语句。5.根据权利要求1所述的方法，其特征在于，依据语音会话样本确定设定身份用户的语音内容之后，包括：依据所述设定身份用户的语音内容的声学特征的变化信息，确定所述设定身份用户的情绪是否异常。6.根据权利要求1所述的方法，其特征在于，依据语音会话样本确定设定身份用户的语音内容之后，包括：识别所述设定身份用户的语音内容的语速；依据识别的语速以及预设的标准语速，确定所述设定身份用户的语速是否异常。7.根据权利要求1所述的方法，其特征在于，依据语音会话样本确定设定身份用户的语音内容之后，包括：识别所述设定身份用户的静音时长；依据识别的静音时长以及预设的标准静音时长，确定所述设定身份用户是否存在超长静音。8.一种语音检测装置，其特征在于，包括：语音内容确定模块，用于依据语音会话样本确定设定身份用户的语音内容；文本内容转化模块，用于将所述设定身份用户的语音内容转化成文本内容；异常问题识别...

【专利技术属性】
技术研发人员：高建忠，雷成军，杨琳琳，程涛远，陈鑫，吴冬雪，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人