语音质量评估方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:28678481 阅读:24 留言:0更新日期:2021-06-02 02:55
本申请实施例属于人工智能中的语音信号处理领域,应用于智慧银行领域中,涉及一种语音质量评估方法,包括对加载到的待评估语音进行序列划分,得到多个时间序列信号;通过各时间序列信号计算待评估语音的第一协方差和第一均值;基于所述第一协方差、所述第一均值以及特征高斯分布,通过分布差距算法计算所述待评估语音与样本语音之间的特征分布差距;根据第一阈值和所述分布差距得到对所述待评估语音的语音质量评估结果。本申请还提供一种语音质量评估装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,所述待评估语音还存储于区块链中。采用本方法大大降低了数据计算量,可以直接应用于移动端业务,实现对语音质量的轻量和快速评估。

【技术实现步骤摘要】
语音质量评估方法、装置、计算机设备和存储介质
本申请涉及语音处理领域,特别是涉及一种语音质量评估方法、装置、计算机设备和存储介质。
技术介绍
现在人工智能在金融领域应用广泛,在移动端开展金融行动的场景也越来越丰富,这些场景中均涉及较为严格的审批业务。其中,如何进行客户留底语音质量好坏的判定是确保留底语音是否可以作为证据的关键,另外语音质量的好坏,也是开启后续众多处理的选择开关。现有的语音质量评估技术分为两类,一类是有参考的评估,需要有纯净的语音作为参考,这不符合大多数业务场景;二类是无参考的评估,这类方法目前所能刻画的语音特征还比较粗糙,并不一定适用在移动端业务中。另外,还需要补充的是,近年来使用深度学习的技术来模仿人类的判断,但是该技术计算开销往往比较大。例如,一种通过从音频信号样本中提取多个特征向量的特征值,并基于该特征值的特征相关联的累积分布函数来预处理特征向量的特征值,以获得预处理的特征值;然后实现神经网络,并基于预处理的特征值确定神经网络参数集,确定音频信号样本的质量分数,以达到改进用于基于神经网或者机器学习评估音频信号样本的语音质量的目的。但是,这种方式需要依赖于神经网络,针对不同的应用场景还需要进行不同的训练,使得语音质量评估的成本大大增加,而且因为是基于深度模型的语音质量评估,就造成了评估方式过于笨重,无法实现移动端实时的评估。
技术实现思路
基于此,针对上述技术问题,本申请提供一种语音质量评估方法、装置、计算机设备及存储介质,以解决现有技术中基于深度模型的语音质量评估,就造成了评估方式过于笨重,无法实现移动端实时的评估。一种语音质量评估方法,所述方法包括:对加载的待评估语音进行序列划分,得到多个时间序列信号;通过各所述时间序列信号计算所述待评估语音的第一协方差和第一均值;构建样本语音的特征高斯分布,基于所述第一协方差、所述第一均值以及特征高斯分布,通过分布差距算法计算所述待评估语音与样本语音之间的特征分布差距;根据第一阈值和所述特征分布差距得到对所述待评估语音的语音质量评估结果。一种语音质量评估装置,所述装置包括:划分模块,用于对加载的待评估语音进行序列划分,得到多个时间序列信号;计算模块,用于通过各所述时间序列信号计算所述待评估语音的第一协方差和第一均值;差距模块,用于构建样本语音的特征高斯分布,基于所述第一协方差、所述第一均值以及特征高斯分布,通过分布差距算法计算所述待评估语音与样本语音之间的特征分布差距;评估模块,用于根据第一阈值和所述特征分布差距得到对所述待评估语音的语音质量评估结果。一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述语音质量评估方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述语音质量评估方法的步骤。上述语音质量评估方法、装置、计算机设备和存储介质,通过根据时间维度将待评估语音划分为多个时间序列信号,然后直接根据时间序列信号计算对应的第一协方差和第一均值,并通过分布差距算法,根据预先拟合好的特征高斯分布直接得到用于体现待评估语音质量的分布差距,得到语音质量评估结果,其中,特征高斯分布是指优质语音的统计特征的高斯分布。本方案可以直接通过简单的分布差距算法、待评估语音的协方差和均值与提前拟合好的特征高斯分布,计算待评估语音与优质语音之间的特征分布差异得到质量评估结果。只需要对待评估语音进行简单的预处理,然后通过分布差距算法便可直接得到质量评估结果,不仅大大降低了数据计算量,可以直接应用于移动端业务,实现对语音质量的轻量和快速评估,而且,通过这种特征分布对比的方式还提高了语音质量评估的准确度和效率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为语音质量评估方法的应用环境示意图;图2为语音质量评估方法的流程示意图;图3为语音质量评估装置的示意图;图4为一个实施例中计算机设备的示意图。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的语音质量评估方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。需要说明的是,本申请实施例所提供的语音质量评估方法一般由服务端/终端执行,相应地,语音质量评估装置一般设置于服务端/终端设备中。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算本文档来自技高网
...

【技术保护点】
1.一种语音质量评估方法,其特征在于,所述方法包括:/n对加载的待评估语音进行序列划分,得到多个时间序列信号;/n通过各所述时间序列信号计算所述待评估语音的第一协方差和第一均值;/n构建样本语音的特征高斯分布,基于所述第一协方差、所述第一均值以及所述特征高斯分布,通过分布差距算法计算所述待评估语音与所述样本语音之间的特征分布差距;/n根据第一阈值和所述特征分布差距对所述待评估语音的语音质量进行评估。/n

【技术特征摘要】
1.一种语音质量评估方法,其特征在于,所述方法包括:
对加载的待评估语音进行序列划分,得到多个时间序列信号;
通过各所述时间序列信号计算所述待评估语音的第一协方差和第一均值;
构建样本语音的特征高斯分布,基于所述第一协方差、所述第一均值以及所述特征高斯分布,通过分布差距算法计算所述待评估语音与所述样本语音之间的特征分布差距;
根据第一阈值和所述特征分布差距对所述待评估语音的语音质量进行评估。


2.根据权利要求1所述的方法,其特征在于,所述对加载的待评估语音进行序列划分,得到多个时间序列信号,包括:
通过时间窗方式对所述待评估语音进行序列划分,得到多个所述时间序列信号。


3.根据权利要求1所述的方法,其特征在于,所述构建样本语音的特征高斯分布,包括:
构建所述样本语音库,其中,所述样本语音库中包括信噪比大于第二阈值的样本语音;
从所述样本语音中提取语音片段序列;
通过序列特征算法提取所述语音片段序列中的统计特征,并基于所述统计特征拟合得到所述特征高斯分布。


4.根据权利要求3所述的方法,其特征在于,所述从所述样本语音提取语音片段序列,包括:
通过时间窗方式对所述样本语音进行序列划分,得到多个语音片段;
计算各所述语音片段中任意两点之间的第一均方差;
根据所述第一均方差和预设形变函数,计算得到各所述语音片段的信息值;并
将所述信息值大于第三阈值的语音片段作为所述语音片段序列。


5.根据权利要求4所述的方法,其特征在于,所述根据所述均方差和预设形变函数,计算得到各所述语音片段的信息值,包括:
通过公式



计算得到所述信息值,其中,δ(b)指信息值,patchb和b指对于一个完整的样本语音中的某一语音片段,i,j分别指所述语音片段中的任意两点,σ(i,j)指i,j两点之间的第一均方差。


6.根据权利要求4...

【专利技术属性】
技术研发人员:陈昊
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1