一种音频流评分方法、装置、设备及存储介质制造方法及图纸

技术编号:19903642 阅读:20 留言:0更新日期:2018-12-26 02:58
本发明专利技术实施例公开了一种音频流评分方法、装置、设备及存储介质。所述方法包括:获取待测音频流,提取所述待测音频流对应的特征数据;根据所述特征数据确定与所述待测音频流相匹配的待测文字序列;根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行评分。通过本发明专利技术实施例的技术方案,能够提高音频流的评分效率和准确率,节约人力资源。

【技术实现步骤摘要】
一种音频流评分方法、装置、设备及存储介质
本专利技术实施例涉及信号处理技术,尤其涉及一种音频流评分方法、装置、设备及存储介质。
技术介绍
学生是一个国家甚至一个民族兴起的重要力量,学校想要更好地教育学生,就需要时刻了解学生的发育和学习状态。传统听觉测试方法中,学生通过播放的声音,复述播放的内容,老师再对学生复述的内容进行打分,由于主要采用人工打分的方式,老师需要听每个学生复述的内容,来进行评分,这种评分方式不仅效率低下,准确率低,而且浪费人力资源。
技术实现思路
本专利技术实施例提供一种音频流评分方法、装置、设备及存储介质,以实现提高音频流的评分效率和准确率,节约人力资源。第一方面,本专利技术实施例提供了一种音频流评分方法,包括:获取待测音频流,提取所述待测音频流对应的特征数据;根据所述特征数据确定与所述待测音频流相匹配的待测文字序列;根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行评分。第二方面,本专利技术实施例还提供了一种音频流评分装置,该装置包括:待测数据提取模块,用于获取待测音频流,提取所述待测音频流对应的特征数据;待测序列确定模块,用于根据所述特征数据确定与所述待测音频流相匹配的待测文字序列;序列匹配评分模块,用于根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行评分。第三方面,本专利技术实施例还提供了一种计算机设备,该设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例中任一所述的音频流评分方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的音频流评分方法。本专利技术实施例通过从待测音频流中提取对应的特征数据,再根据该特征数据确定待测音频流中的待测文字序列,最后根据该待测文字序列与标准文字序列之间的匹配度对该待测音频流进行评分,利用自动提取和比对音频流中的文字序列来给音频流评分,解决了现有技术中的听觉测试因采用人工打分的方式,而导致的评分方式不仅效率低下、准确率低、浪费人力资源的问题,实现了提高音频流的评分效率和准确率,节约人力资源的效果。附图说明图1是本专利技术实施例一提供的一种音频流评分方法的流程示意图;图2是本专利技术实施例二提供的一种音频流评分装置的结构示意图;图3是本专利技术实施例三提供的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种音频流评分方法的流程示意图。该方法可适用于对音频流进行评分的情况,该方法可以由音频流评分装置来执行,该装置可由硬件和/或软件组成,并一般可集成在听觉测试系统服务器以及所有包含音频流评分功能的终端中。其中,听觉测试系统可包括服务器、教师端和学生端,具体可通过将教师端采集的教师语音信号或服务器中预设的标准语音信号发送给学生端,学生端将该语音信号播放给学生听,以使学生根据听到的语音信号的内容,对该内容进行复述,并将采集的学生语音信号提交给服务器,最终服务器根据该学生语音信号与教师语音信号或标准语音信号对学生语音信号进行评分,检查学生复述的是否正确,从而完成对学生的听觉测试。本实施例以听觉测试系统中的服务器为执行主体进行举例说明,具体包括如下:S110、获取待测音频流,提取待测音频流对应的特征数据。其中,待测音频流可以是听觉测试系统中学生端采集并发送给服务器的学生语音信号。特征数据可以为能够表征待测音频流中发音内容的数据,根据语言的不同而不同。例如,可利用音节、因素和/或声调来表征汉语发音内容。可选的,特征数据包括音节、音素和声调。以汉语为例,每个字都是由一个音节组成,比如“九”的音节是jiu;一个音节包括一个或多个音素,比如“九”由两个音素组成分别是“j”和“iou”;一个音节可对应于一个声调,比如“九”的声调为上声(也即第三声)。因此,可通过分析提取音频流中所包含的音节、音素以及声调来获取音频流中的发音内容,从而利用该发音内容获取待测音频流中的语音内容与教师语音信号或标准语音信号中的语音内容是否一致,来对待测音频流进行评分。可选的,提取待测音频流对应的特征数据,包括:按照预设算法获取待测音频流的音频信号特征;将音频信号特征输入至特征检测模型中,得到与待测音频流对应的特征数据。其中,预设算法可以为频谱特征提取算法,例如MFCC(Mel-FrequencyCepstralCoefficients,梅尔频率倒谱系数)算法,相应的,按照预设算法获取的音频信号特征为时间-音频特征。具体的,MFCC特征提取包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析。示例性的,利用MFCC提取音频信号特征的具体步骤如下:1、将待测音频流分解为帧;2、对于每一帧,计算周期功率谱;3、将Mel滤波器应用到功率谱中,计算每个滤波器的能量和;4、计算能量的对数值;5、对每个对数能量进行离散余弦变换(DCT);6、保留DCT的2-13个系数,其余系数舍去。这样,对于待测音频流中的每一帧即可得到2-13个梅尔频率倒谱系数,以表征待测音频流中每一帧的频谱特征。本实施例中特征检测模型用于对输入的音频信号特征进行识别,输出与该音频信号特征对应的特征数据。具体的,特征检测模型可以是按照预设机器学习算法训练出来的模型。示例性的,将获取的音频信号特征输入至该特征检测模型中,其所输出的特征数据包括但不限于音频信号特征对应的音节、音素、声调等。举一个具体例子,获取含有“七八九”发音的待测音频流,对待测音频流进行MFCC特征提取,得到时间-音频特征,再将该时间-音频特征输入至特征检测模型,即可输出“qibajiu”的音节信息,“qibajiou”的因素信息,以及“阴平、阴平、上声”的声调信息。相应的,在获取待测音频流,提取待测音频流对应的特征数据之前,还包括:获取标注有特征数据的音频流样本;基于音频流样本对第一神经网络模型进行训练,得到特征检测模型。其中,音频流样本可从预设测试题库中随机抽取,该预设测试题库可预先存储在听觉测试系统服务器中。具体的,可对每个音频流样本中包含的发音内容进行特征数据的标注,也即一个音频流样本对应于一个特征数据,标注方式可以为人工方式。例如,将含有“四五六”发音的音频流样本标注为:音频信息“siwuliu”,音素信息“siwuliou”,声调信息“去声、上声、去声”。本实施例中第一神经网络模型可以是基于人工神经网络算法建立的训练模型,例如CNN卷积神经网络(ConvolutionalNeuralNetwork,CNN),CNN是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元。具体的,对第一神经网络模型进行训练的过程可以是调整各神经网络参数的过程,经过不断的训练,获得最优的神经网络参数,具有最优神经网络参数的第一神经网络模型即为最终要获得的模型。示例性的,在获得多个标注有特征数据的音频流样本后,使用多个音频流样本对第一神经网络模型进行训练,不断本文档来自技高网...

【技术保护点】
1.一种音频流评分方法,其特征在于,包括:获取待测音频流,提取所述待测音频流对应的特征数据;根据所述特征数据确定与所述待测音频流相匹配的待测文字序列;根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行评分。

【技术特征摘要】
1.一种音频流评分方法,其特征在于,包括:获取待测音频流,提取所述待测音频流对应的特征数据;根据所述特征数据确定与所述待测音频流相匹配的待测文字序列;根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行评分。2.根据权利要求1所述的方法,其特征在于,在根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行评分之前,还包括:获取标准音频流,提取所述标准音频流对应的特征数据;根据所述特征数据确定与所述标准音频流相匹配的文字序列,作为标准文字序列。3.根据权利要求1或2所述的方法,其特征在于,所述提取所述待测音频流对应的特征数据,包括:按照预设算法获取所述待测音频流的音频信号特征;将所述音频信号特征输入至特征检测模型中,得到与所述待测音频流对应的特征数据;相应的,在获取待测音频流,提取所述待测音频流对应的特征数据之前,还包括:获取标注有特征数据的音频流样本;基于所述音频流样本对第一神经网络模型进行训练,得到所述特征检测模型。4.根据权利要求1或2所述的方法,其特征在于,所述根据所述特征数据确定与所述待测音频流相匹配的待测文字序列,包括:将所述特征数据输入至序列检测模型中,得到与所述待测音频流相匹配的待测文字序列;相应的,在根据所述特征数据确定与所述待测音频流相匹配的待测文字序列之前,还包括:获取标注有文字时序的特征数据样本;基于所述特征数据样本对第二神经网络模型进行训练,得到所述序列检测模型。5.根据权利要求1或2所述的方法,其特征在于,所述根据所述待测文字序列与标准文字序列之间的匹配度,对所述待测音频流进行...

【专利技术属性】
技术研发人员:刘骋
申请(专利权)人:上海慧子视听科技有限公司刘骋
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1