基于录音的复述测评方法、装置、设备和介质制造方法及图纸

技术编号:39997356 阅读:28 留言:0更新日期:2024-01-09 02:54
本申请的一种基于录音的复述测评方法,包括:获取原始录音;对原始录音进行预处理,得到预处理音频。使用弱语言模型对预处理音频进行语音识别,得到复述文本;其中,所述弱语言模型由噪声数据集训练得到。提取复述文本的局部文本特征。提取复述文本的自身特征,提取复述文本、原文文本和参考答案文本之间的关联特征。根据自身特征、关联特征和局部文本特征建立回归模型,预测复述评分。弱语言模型能够防止对复述过程中出现的错误进行纠正,从而使得复述文本不失真。通过提取局部文本特征、自身特征和关联特征,能够将全局文本特征和局部文本特征结合,提高自动评分的准确率,减小自动评分与人工评分之间的差异。

【技术实现步骤摘要】

本申请涉及语义识别,例如涉及一种基于录音的复述测评方法、装置、设备和介质


技术介绍

1、口语评测是计算机辅助语言学习的一个重要组成部分。对于中国人学习英语来说,口语评测可以分为文本相关与文本无关两大类,前者指的是朗读等有原文的类型,后者指的是根据听录音、看图、阅读等进行复述、口头作文等没有原文的类型。

2、现有的根据录音进行复述的口语测评技术根据语音特征和语音识别结果建立机器学习评分模型,语音识别结果仅仅用到了局部文本特征,例如关键词覆盖率、词语相似度以及文本相似度。但是,语义识别结果不包括全局文本特征,导致自动评分不准确,自动评分与人工评分出现显著差异。


技术实现思路

1、本申请目的在于:提供一种基于录音的复述测评方法、装置、设备和介质,通过结合复述文本的局部文本特征和全局文本特征,能够提高自动评分的准确率。

2、为达到上述目的,本申请提供了一种基于录音的复述测评方法,包括:

3、获取原始录音;对所述原始录音进行预处理,得到预处理音频;

4、使用弱语言模型对本文档来自技高网...

【技术保护点】

1.一种基于录音的复述测评方法,其特征在于,包括:

2.根据权利要求1所述的基于录音的复述测评方法,其特征在于,所述噪声数据集为含有固有噪声的数据集或含有人工添加噪声的数据集,所述噪声数据集的噪声比例为10%-20%。

3.根据权利要求1所述的基于录音的复述测评方法,其特征在于,所述提取所述复述文本的自身特征,包括:

4.根据权利要求3所述的基于录音的复述测评方法,其特征在于,所述提取所述复述文本的自身特征,包括:

5.根据权利要求1所述的基于录音的复述测评方法,其特征在于,所述提取所述复述文本、原文文本和参考答案文本之间的关联特征,包括:...

【技术特征摘要】

1.一种基于录音的复述测评方法,其特征在于,包括:

2.根据权利要求1所述的基于录音的复述测评方法,其特征在于,所述噪声数据集为含有固有噪声的数据集或含有人工添加噪声的数据集,所述噪声数据集的噪声比例为10%-20%。

3.根据权利要求1所述的基于录音的复述测评方法,其特征在于,所述提取所述复述文本的自身特征,包括:

4.根据权利要求3所述的基于录音的复述测评方法,其特征在于,所述提取所述复述文本的自身特征,包括:

5.根据权利要求1所述的基于录音的复述测评方法,其特征在于,所述提取所述复述文本、原文文本和参考答案文本之间的关联特征,包括:

6.根据权利要求5所述的基于录音的复述测评方法,其特征在于,所述...

【专利技术属性】
技术研发人员:张似衡叶珑
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1