用于音调和语音分类的累积平均频谱熵分析制造技术

技术编号:37178712 阅读:11 留言:0更新日期:2023-04-20 22:46
根据实施方案的一种用于执行包括音调和语音分类的呼叫进程分析的联络中心系统,包括至少一个处理器和至少一个存储器,该至少一个存储器包括存储在其上的多个指令,这些指令响应于由至少一个处理器执行而使联络中心系统:确定由联络中心系统接收的音频信号的熵的累积平均值;确定音频信号的累积平均功率频谱幅度和累积平均频谱熵;将音频信号的差异度量计算为熵的累积平均值和累积平均频谱熵之间的差;基于差异度量将音频信号的音调和语音区分开;以及响应于音频信号中的一个或多个音调的识别,处理音频信号的一个或多个音调。处理音频信号的一个或多个音调。处理音频信号的一个或多个音调。

【技术实现步骤摘要】
【国外来华专利技术】用于音调和语音分类的累积平均频谱熵分析
[0001]相关申请的交叉引用
[0002]本申请要求于2020年6月30日提交的题为“Cumulative Average Spectral Entropy Analysis for Tone and Speech Classification”的美国临时申请63/045,908的优先权和权益,其内容全文以引用方式并入本文。

技术介绍

[0003]呼叫分析或呼叫进程分析(CPA)是一个用于一组信号处理算法的术语,该组信号处理算法在呼叫设置期间在音频信号(由音调和语音两者组成)上操作,以便确定呼叫的结果。人类能够容易地收听和检测各种音调(例如,拨号前的拨号音、回铃、占线、应答等)。然而,要让一台机器能够以同样的精度做同样的事情,在其实现过程中(特别是当网络载波消息中的人类语音必须与各种音调区分开来时)需要非常小心。
[0004]具有呼出呼叫能力的电话应用程序需要准确和快速地解释由网络传递给呼叫实体的呼叫进程音调(例如,回铃和占线)的能力。尽管国际电信联盟公布了每个国家的建议音调定义,这些建议音调定义在很大程度上得到遵循,但仍然没有一套一致的、标准的音调频率和模式供所有电话提供商在全球范围内使用以表示特定事件,这使得呼叫进程分析变得复杂。提供商使用各种方法来尝试检测和识别在分析呼叫进程的过程中涉及的不同音调。然而,当在分析中的音频信号由于较差传输网络或其他原因而被劣化时,当前采用的大多数信号处理算法常常不能充分发挥功能。

技术实现思路

[0005]一个实施方案涉及用于音调和语音分类的累积平均频谱熵分析的独特系统、部件和方法。其他实施方案涉及用于音调和语音分类的累积平均频谱熵分析的装置、系统、设备、硬件、方法和其组合。
[0006]根据实施方案,一种用于使用音调和语音分类来执行呼叫进程分析的联络中心系统可以包括至少一个处理器和至少一个存储器,该至少一个存储器包括存储在其上的多个指令,这些指令响应于由至少一个处理器执行而使联络中心系统:确定由联络中心系统接收的音频信号的熵的累积平均值;确定音频信号的累积平均功率频谱幅度并基于音频信号的累积平均功率频谱幅度确定音频信号的累积平均频谱熵;将音频信号的差异度量计算为音频信号的熵的累积平均值与音频信号的累积平均频谱熵之间的差;基于音频信号的差异度量将音频信号的音调和语音区分开;以及响应于音频信号中的一个或多个音调的识别,处理音频信号的一个或多个音调。
[0007]在一些实施方案中,处理音频信号的一个或多个音调可以包括:识别音频信号的一个或多个音调中的呼叫进程音调模式,并且响应于音频信号的一个或多个音调中的呼叫进程音调模式的识别,将电话呼叫从联络中心系统的第一系统转移到联络中心系统的第二系统。
[0008]在一些实施方案中,处理音频信号的一个或多个音调可以包括将呼出呼叫连接到
联络中心系统的自动交互式语音应答(IVR)系统。
[0009]在一些实施方案中,处理音频信号的一个或多个音调可以包括将呼出呼叫连接到联络中心系统的座席。
[0010]在一些实施方案中,音频信号的一个或多个音调可以包括呼叫进程音调模式。
[0011]在一些实施方案中,呼叫进程音调模式可以是占线信号模式、回铃模式或特殊信息音调模式。
[0012]在一些实施方案中,处理音频信号的一个或多个音调可以包括确定音频信号的一个或多个音调中的每个音调的对应频率。
[0013]在一些实施方案中,确定音频信号的熵的累积平均值可以包括计算音频信号的熵。
[0014]根据另一实施方案,一种或多种非暂态机器可读存储介质,其包括存储在其上的多个指令,这些指令响应于由至少一个处理器的执行可以使联络中心系统:计算由联络中心系统接收的音频信号的熵;计算音频信号的熵的累积平均值;计算音频信号的累积平均功率频谱幅度;基于音频信号的累积平均功率频谱幅度,计算音频信号的累积平均频谱熵;将音频信号的差异度量计算为音频信号的熵的累积平均值与音频信号的累积平均频谱熵之间的差;基于音频信号的差异度量对音频信号的音调和语音进行分类;以及响应于音频信号中的一个或多个音调的识别,处理音频信号的一个或多个音调。
[0015]在一些实施方案中,处理音频信号的一个或多个音调可以包括:响应于音频信号的一个或多个音调中的呼叫进程音调模式的识别,将电话呼叫从联络中心系统的第一系统转移到联络中心系统的第二系统。
[0016]在一些实施方案中,处理音频信号的一个或多个音调可以包括将呼出呼叫连接到联络中心系统的自动交互式语音应答(IVR)系统。
[0017]在一些实施方案中,处理音频信号的一个或多个音调可以包括将呼出呼叫连接到联络中心系统的座席。
[0018]在一些实施方案中,音频信号的一个或多个音调可以包括呼叫进程音调模式。
[0019]在一些实施方案中,呼叫进程音调模式可以是占线信号模式、回铃模式或特殊信息音调模式。
[0020]在一些实施方案中,处理音频信号的一个或多个音调可以包括确定音频信号的一个或多个音调中的每个音调的对应频率。
[0021]根据又另一实施方案,一种在联络中心系统中使用音调和语音分类来执行呼叫进程分析的方法可以包括:由联络中心系统接收音频信号;由联络中心系统确定由联络中心系统接收的音频信号的熵;由联络中心系统确定音频信号的熵的累积平均值;由联络中心系统确定音频信号的累积平均功率频谱幅度;由联络中心系统基于音频信号的累积平均功率频谱幅度确定音频信号的累积平均频谱熵;由联络中心系统将音频信号的差异度量确定为音频信号的熵的累积平均值与音频信号的累积平均频谱熵之间的差;由联络中心系统基于音频信号的差异度量对音频信号的音调和语音进行分类;以及响应于音频信号中的一个或多个音调的识别,由联络中心系统处理音频信号的一个或多个音调。
[0022]在一些实施方案中,处理音频信号的一个或多个音调可以包括:识别音频信号的一个或多个音调中的呼叫进程音调模式,并且响应于识别音频信号的一个或多个音调中的
呼叫进程音调模式,将电话呼叫从联络中心系统的第一系统转移到联络中心系统的第二系统。
[0023]在一些实施方案中,处理音频信号的一个或多个音调可以包括将呼出呼叫连接到联络中心系统的座席或自动交互式语音应答(IVR)系统中的一者。
[0024]在一些实施方案中,音频信号的一个或多个音调可以包括呼叫进程音调模式。
[0025]在一些实施方案中,处理音频信号的一个或多个音调可以包括确定音频信号的一个或多个音调中的每个音调的对应频率。
[0026]本
技术实现思路
不旨在识别所要求保护的主题的关键或必要特征,也不旨在用作限制所要求保护的主题的范围的辅助。本申请的其他实施方案、形式、特征和方面将根据随本文提供的描述和附图变得显而易见。
附图说明
[0027]本文描述的概念在附图中通过举例的方式并且不是通过限制的方式进行说明。为了简单和清楚说明,图中示出的元件不一定按比例绘制。在认为适当的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于使用音调和语音分类来执行呼叫进程分析的联络中心系统,所述联络中心系统包括:至少一个处理器;和至少一个存储器,所述至少一个存储器包括存储在其上的多个指令,所述多个指令响应于由所述至少一个处理器执行而使所述联络中心系统:确定由所述联络中心系统接收的音频信号的熵的累积平均值;确定所述音频信号的累积平均功率频谱幅度,并基于所述音频信号的所述累积平均功率频谱幅度确定所述音频信号的累积平均频谱熵;将所述音频信号的差异度量计算为所述音频信号的所述熵的所述累积平均值与所述音频信号的所述累积平均频谱熵之间的差;基于所述音频信号的所述差异度量将所述音频信号的音调和语音区分开;以及响应于所述音频信号中的一个或多个音调的识别,处理所述音频信号的一个或多个音调。2.根据权利要求1所述的联络中心系统,其中处理所述音频信号的所述一个或多个音调包括:识别所述音频信号的所述一个或多个音调中的呼叫进程音调模式;以及响应于所述音频信号的所述一个或多个音调中的所述呼叫进程音调模式的识别,将电话呼叫从所述联络中心系统的第一系统转移到所述联络中心系统的第二系统。3.根据权利要求1所述的联络中心系统,其中处理所述音频信号的所述一个或多个音调包括将呼出呼叫连接到所述联络中心系统的自动交互式语音应答(IVR)系统。4.根据权利要求1所述的联络中心系统,其中处理所述音频信号的所述一个或多个音调包括将呼出呼叫连接到所述联络中心系统的座席。5.根据权利要求1所述的联络中心系统,其中所述音频信号的所述一个或多个音调包括呼叫进程音调模式。6.根据权利要求1所述的联络中心系统,其中所述呼叫进程音调模式包括占线信号模式、回铃模式或特殊信息音调模式中的一种模式。7.根据权利要求1所述的联络中心系统,其中处理所述音频信号的所述一个或多个音调包括确定所述音频信号的所述一个或多个音调中的每个音调的对应频率。8.根据权利要求1所述的联络中心系统,其中确定所述音频信号的所述熵的所述累积平均值包括计算所述音频信号的所述熵。9.一种或多种非暂态机器可读存储介质,所述一种或多种非暂态机器可读存储介质包括存储在其上的多个指令,所述多个指令响应于由至少一个处理器执行而使联络中心系统:计算由所述联络中心系统接收的音频信号的熵;计算所述音频信号的所述熵的累积平均值;计算所述音频信号的累积平均功率频谱幅度;基于所述音频信号的所述累积平均功率频谱幅度,计算所述音频信号的累积平均频谱熵;将所述音频信号的差异度量计算为所述音频信号的所述熵的所述累积平均值与所述
音频信号的所述累积平均频谱熵之间的差;基于所述音频信号的所述差异度量对所述音频信号的音调和语音进行分类;以及响应于所述音频信号中的一个或多个音调的识别,处理所述音频信号的一个或多个音调。10.根据权利要求9所述的一种或多种...

【专利技术属性】
技术研发人员:R
申请(专利权)人:吉尼赛斯云服务第二控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1