一种语音检测方法、装置及设备制造方法及图纸

技术编号:17657231 阅读:17 留言:0更新日期:2018-04-08 09:47
本发明专利技术实施例公开了一种语音检测方法、装置及设备。该方法包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。本发明专利技术实施例提供的技术方案,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。

【技术实现步骤摘要】
一种语音检测方法、装置及设备
本专利技术涉及语音处理
,尤其涉及一种语音检测方法、装置及设备。
技术介绍
公司的发展往往是靠业务拉动的,销售和客服积累了公司的众多业务信息,销售/客服和客户的沟通电话,汇集了众多的动态业务信息,对于公司来说,如果能从这些录音中挖掘有用的商业线索数据,对于公司把握市场,洞察先机,能够赢得客户,至关重要。电话销售是企业呼叫中心(CallCenter)的核心业务。规范化的服务对于呼叫质量的提升意义重大。目前,企业呼叫中心对电话销售质量的运营管理还停留在人工阶段,虽然配备质检人员进行抽检,但由于是随机抽样,且抽样比例非常低,使得问题电话的检出率极低。同时,由于需要人工测听确认,质检员的工作效率也不高。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音检测方法、装置及设备,以提高语音内容中包含的异常问题的检出率以及语音检测效率。第一方面,本专利技术实施例提供了一种语音检测方法,包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。第二方面,本专利技术实施例提供了一种语音检测装置,包括:语音内容确定模块,用于依据语音会话样本确定设定身份用户的语音内容;文本内容转化模块,用于将所述设定身份用户的语音内容转化成文本内容;异常问题识别模块,用于依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。第三方面,本专利技术实施例还提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例所述的方法。本专利技术实施例提供的技术方案,通过依据语音会话样本确定设定身份用户的语音内容,随后,将设定身份用户的语音内容转化为文本内容,并依据问题识别模型确定文本内容中是否包含异常问题,从而依据确定结果能够检测设定身份用户的语音内容中是否包含异常问题,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。附图说明图1是本专利技术实施例一提供的一种语音检测方法的流程图;图2是本专利技术实施例二提供的一种语音检测方法的流程图;图3是本专利技术实施例三提供的一种语音检测方法的流程图;图4是本专利技术实施例三提供的语音检测方法的示意图;图5是本专利技术实施例四提供的一种语音检测装置的结构图;图6是本专利技术实施例五提供的一种设备的结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1是本专利技术实施例一提供的一种语音检测方法的流程图。本实施例的方法可以由语音检测装置来执行,该装置可通过硬件和/或软件的方式实现。本实施例的方法一般可适用于对语音内容进行质量检测的情形。参考图1,本实施例提供的语音检测方法具体可以包括如下:S11、依据语音会话样本确定设定身份用户的语音内容。在本实施例中,语音会话样本指的是不同身份用户之间的语音会话内容,且不同身份用户的语音会话内容混杂在一起,例如,语音会话样本可以是企业呼叫中心收集的客户与销售或客服的电话沟通内容。设定身份用户指的是待对其语音内容进行语音检测的用户,其中设定身份用户可以是客户、销售或客服等,例如,若想要对客服类用户的语音内容进行检测,则设定身份用户是客服类用户;若想要对销售类用户的语音内容进行检测,则设定身份用户是销售类用户;若想要对客户类用户的语音内容进行检测,则设定身份用户是客户类用户。具体的,从混杂有不同身份用户的语音内容的语音会话样本中筛选出属于设定身份用户的语音内容。S12、将所述设定身份用户的语音内容转化成文本内容。具体的,可以采用光学字符识别(OpticalCharacterRecognition,OCR)技术将设定身份用户的语音语句转化成文本内容。S13、依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题。其中,所述问题识别模型可以是依据问题文本内容训练得到的,用于识别文本内容中是否包含异常问题。问题文本内容指的是包含异常问题的文本内容。本实施例提供的技术方案,通过依据语音会话样本确定设定身份用户的语音内容,随后,将设定身份用户的语音内容转化为文本内容,并依据问题识别模型确定文本内容中是否包含异常问题,从而依据确定结果能够检测设定身份用户的语音内容中是否包含异常问题,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率。并且,由于语音检测效率提高,能够将现有的“抽检方式”变为“全覆盖检测方式”,即能够对设定身份用户的所有语音内容进行自动检测,异常问题的检出率大大提高。实施例二本实施例在上述实施例一的基础上提供了一种新的语音检测方法。图2是本专利技术实施例二提供的一种语音检测方法的流程图。参考图2,本实施例提供的语音检测方法具体可以包括如下:S21、依据语音会话样本确定设定身份用户的语音内容。S22、将所述设定身份用户的语音内容转化成文本内容。S23、依据问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数。在本实施例中,问题识别模型可以通过如下方式训练得到:获取人工标注的问题文本;确定问题文本中包含的问题词以及问题词的权重,并依据确定结果得到问题识别模型。其中,问题词可以包括但不限于威胁词、辱骂词、虚假信息词和私自交易词。问题词的权重可以是依据检测需求设定的经验值。具体的,将文本内容与问题识别模型进行匹配,依据问题识别模型中包含的问题词以及问题词的权重,确定文本内容的问题指数。例如,可以依据如下公式确定文本内容的问题指数:λ=k1w1+k2w2+…+knwn,其中λ指的是文本内容的问题指数,w1,w2,…,wn指的是文本内容中包含的问题词,k1,k2,…,kn依次是问题词w1,w2,…,wn1的权重。S24、若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。其中,问题指数阈值可以是依据检测需求确定的经验值,如问题指数阈值可以是65%或70%等。具体的,若文本内容的问题指数大于问题指数阈值,则确定文本内容包含异常问题;否则,确定文本内容不包含异常问题。本实施例提供的技术方案,通过依据语音会话样本确定设定身份用户的语音内容,将设定身份用户的语音内容转化为文本内容,随后,依据问题识别模型中包含的问题词以及问题词的权重,确定文本内容的问题指数,若文本内容的问题指数大于问题指数阈值,则确定文本内容包含异常问题,即具体提供了基于问题识别模型识别异常问题的方式。实施例三本实施例在上述实施例一的基础上提供了一种新的语音检测方法。图3是本专利技术实施例三提供的一种语音检测方法的流程图。参考图3,本实施例提供的语音检测方法具体可以包括如下:S31、确定语音会话样本中包含的不同用户的会话语句。示例性的,S31可以包括:依据所述语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话本文档来自技高网...
一种语音检测方法、装置及设备

【技术保护点】
一种语音检测方法,其特征在于,包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。

【技术特征摘要】
1.一种语音检测方法,其特征在于,包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。2.根据权利要求1所述的方法,其特征在于,依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,包括:依据所述问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数;若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。3.根据权利要求1所述的方法,其特征在于,依据语音会话样本确定设定身份用户的语音内容,包括:确定所述语音会话样本中包含的不同用户的会话语句;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份;确定所述设定身份用户的语音内容。4.根据权利要求3所述的方法,其特征在于,确定语音会话样本中包含的不同用户的会话语句,包括:依据所述语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话语句;或者,识别所述语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的语句进行聚类,依据聚类结果确定不同用户的会话语句。5.根据权利要求1所述的方法,其特征在于,依据语音会话样本确定设定身份用户的语音内容之后,包括:依据所述设定身份用户的语音内容的声学特征的变化信息,确定所述设定身份用户的情绪是否异常。6.根据权利要求1所述的方法,其特征在于,依据语音会话样本确定设定身份用户的语音内容之后,包括:识别所述设定身份用户的语音内容的语速;依据识别的语速以及预设的标准语速,确定所述设定身份用户的语速是否异常。7.根据权利要求1所述的方法,其特征在于,依据语音会话样本确定设定身份用户的语音内容之后,包括:识别所述设定身份用户的静音时长;依据识别的静音时长以及预设的标准静音时长,确定所述设定身份用户是否存在超长静音。8.一种语音检测装置,其特征在于,包括:语音内容确定模块,用于依据语音会话样本确定设定身份用户的语音内容;文本内容转化模块,用于将所述设定身份用户的语音内容转化成文本内容;异常问题识别...

【专利技术属性】
技术研发人员:高建忠雷成军杨琳琳程涛远陈鑫吴冬雪
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1