一种口语复述评分方法及系统技术方案

技术编号:18733849 阅读:14 留言:0更新日期:2018-08-22 03:31
本发明专利技术公开了一种口语复述评分方法,包括:获取用户复述标准文本内容的待评分语音;基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音;根据所述词语语音的平均时长,计算获得流利度评分;基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语;将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分;根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分。相应的,本发明专利技术还公开了一种口语复述评分系统。采用本发明专利技术实施例,能够对口语复述进行全面、客观、合理的评价。

【技术实现步骤摘要】
一种口语复述评分方法及系统
本专利技术涉及语音信号处理领域,尤其涉及一种口语复述评分方法及系统。
技术介绍
口语复述题是考察学生学习语言口语听说能力的一种常见题型,一般为英语口语复述题,指让考生听一整段英文段落后,考生能用英语复述出所听英文段落。近年来出现了一些基于计算机和网络技术的英语口语机考系统,如上海外语教育出版社的口语机考系统、蓝鸽的系统等,实现了考官和考生在场所上的分离,支持了大规模的口语考试的组织。但在阅卷方面,仅支持客观题的阅卷,主观题的阅卷工作仍需要投入大量的人力物力,例如英语考试主观题当中的复述题。现阶段的口语复述题改卷绝大多数仍是采用人工改卷,但由于人工改卷结果受改卷人的主观影响较大,评卷结果受评卷人的生理条件、情绪、时间等诸多因素的影响,且人工评卷工作效率低下。另外,还有一些口语复述题考试客观评价系统只是针对关键单词的评价,且大多只是根据关键词给出一个分数,并没有根据语义、语句相似度等方面给出相应的评分。因此,对于口语复述题这种开放性题目无法给出全面客观合理的评价。
技术实现思路
本专利技术实施例提出一种口语复述评分方法及系统,能够对口语复述进行全面、客观、合理的评价。本专利技术实施例提供一种口语复述评分方法,包括:获取用户复述标准文本内容的待评分语音;基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音;根据所述词语语音的平均时长,计算获得流利度评分;基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语;将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分;根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分。进一步地,所述基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音,具体包括:对所述待评分语音进行分帧处理;提取每帧语音的特征参数;所述特征参数包括梅尔频率倒谱系数和过零率;基于BP神经网络的连续语音切词算法,根据每帧语音的特征参数将所述待评分语音切分为词语语音,并标识每个词语语音为有效语音或无效语音。进一步地,所述根据所述词语语音的平均时长,计算获得流利度评分,具体包括:计算所有有效语音的平均时长作为平均词语时长;计算所有无效语音的平均时长作为平均停顿时长;将所述平均词语时长和所述平均停顿时长分别与其对应的语速阈值进行比较,根据比较结果计算获得流利度评分。进一步地,所述基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语,具体包括:提取每个词语语音的特征参数;所述特征参数包括梅尔频率倒谱系数和过零率;基于BP神经网络的语音识别算法,根据每个词语语音的特征参数将所述词语语音识别为相应的词语。进一步地,所述将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分,具体包括:将所有词语与标准文本中的关键词逐一进行对比,获得关键词评分;所述关键词评分是对用户用词准确度的评分;将所有词语与标准文本中的所有关键词进行整体对比,获得文本相关度评分;所述文本相关度评分是对用户复述完整性的评分。进一步地,所述将所有词语与标准文本中的关键词逐一进行对比,获得关键词评分,具体包括:检测所有词语中包含所述关键词的个数,计算包含的个数与关键词总个数的比例,获得关键词覆盖率;从所有词语中查找出与未包含的关键词相匹配的词语;计算所述未包含的关键词与其相匹配的词语之间的语义相似度;根据所述关键词覆盖率和所述语义相似度,获得关键词评分。进一步地,所述计算所述未包含的关键词与相匹配的词语之间的语义相似度,具体包括:通过预设的同义词词典分别提取所述未包含的关键词的第一词汇语义特征和所述相匹配的词语的第二词汇语义特征;根据所述第一词汇语义特征和所述第二词汇语义特征计算所述未包含的关键词与相匹配的词语之间的意义相似度;根据所述意义相似度计算所述未包含的关键词与相匹配的词语之间的语义相似度。进一步地,所述将所有词语与标准文本中的所有关键词进行整体对比,获得文本相关度评分,具体包括:去掉所有词语中的停用词,并根据剩下词语的频度确定至少一个特征词;根据每个特征词对文本特征的体现效果设置相应的权值,并根据所有特征词的权值构建第一权值向量;按照所有特征词的权值的排列顺序,根据标准文本中所有关键词的权值构建第二权值向量;计算所述第一权值向量和所述第二权值向量的余弦相似度,并根据所述余弦相似度计算获得文本相关度评分。进一步地,所述根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分,具体包括:基于线性回归模型分配所述流利度评分、所述关键词评分和所述文本相关度评分的权重;根据所述流利度评分、所述关键词评分和所述文本相关度评分及相应的权重,计算获得待评分语音的综合评分。相应地,本专利技术实施例还提供一种口语复述评分系统,能够实现上述口语复述评分方法的所有流程,所述口语复述评分系统包括:获取模块,用于获取用户复述标准文本内容的待评分语音;切词模块,用于基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音;第一评分模块,用于根据所述词语语音的平均时长,计算获得流利度评分;语音识别模块,用于基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语;第二评分模块,用于将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分;以及,综合评分模块,用于根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分。实施本专利技术实施例,具有如下有益效果:本专利技术实施例提供的口语复述评分方法及系统,能够基于BP神经网络的连续语音切词算法将待评分语音切分为词语语音,以根据词语语音计算流利度评分,基于BP神经网络的语音识别算法对词语语音进行识别,并根据识别出的词语进行关键词评分和文本相关度评分,最后根据流利度评分、关键词评分和文本相关度评分多个参量,计算出综合评分,实现对口语复述的全面、客观、合理的评价。附图说明图1是本专利技术提供的口语复述评分方法的一个实施例的流程示意图;图2是本专利技术提供的口语复述评分方法中语音识别的一个实施例的原理图;图3是本专利技术提供的口语复述评分方法的另一个实施例的流程示意图;图4是本专利技术提供的口语复述评分系统的一个实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术提供的口语复述评分方法的一个实施例的流程示意图,包括:S1、获取用户复述标准文本内容的待评分语音;S2、基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音;S3、根据所述词语语音的平均时长,计算获得流利度评分;S4、基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语;S5、将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分;S6、根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分。需要说明的是,在评分之前,建立由发音标准的专业人士或者母语(一般为英语)人士在特定本文档来自技高网...

【技术保护点】
1.一种口语复述评分方法,其特征在于,包括:获取用户复述标准文本内容的待评分语音;基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音;根据所述词语语音的平均时长,计算获得流利度评分;基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语;将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分;根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分。

【技术特征摘要】
1.一种口语复述评分方法,其特征在于,包括:获取用户复述标准文本内容的待评分语音;基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音;根据所述词语语音的平均时长,计算获得流利度评分;基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语;将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分;根据所述流利度评分、所述关键词评分和所述文本相关度评分,计算获得待评分语音的综合评分。2.如权利要求1所述的口语复述评分方法,其特征在于,所述基于BP神经网络的连续语音切词算法将所述待评分语音切分为词语语音,具体包括:对所述待评分语音进行分帧处理;提取每帧语音的特征参数;所述特征参数包括梅尔频率倒谱系数和过零率;基于BP神经网络的连续语音切词算法,根据每帧语音的特征参数将所述待评分语音切分为词语语音,并标识每个词语语音为有效语音或无效语音。3.如权利要求2所述的口语复述评分方法,其特征在于,所述根据所述词语语音的平均时长,计算获得流利度评分,具体包括:计算所有有效语音的平均时长作为平均词语时长;计算所有无效语音的平均时长作为平均停顿时长;将所述平均词语时长和所述平均停顿时长分别与其对应的语速阈值进行比较,根据比较结果计算获得流利度评分。4.如权利要求1所述的口语复述评分方法,其特征在于,所述基于BP神经网络的语音识别算法将所述词语语音识别为相应的词语,具体包括:提取每个词语语音的特征参数;所述特征参数包括梅尔频率倒谱系数和过零率;基于BP神经网络的语音识别算法,根据每个词语语音的特征参数将所述词语语音识别为相应的词语。5.如权利要求1所述的口语复述评分方法,其特征在于,所述将所有词语与标准文本中的关键词进行对比,获得关键词评分和文本相关度评分,具体包括:将所有词语与标准文本中的关键词逐一进行对比,获得关键词评分;所述关键词评分是对用户用词准确度的评分;将所有词语与标准文本中的所有关键词进行整体对比,获得文本相关度评分;所述文本相关度评分是对用户复述完整性的评分。6.如权利要求5所述的口语复述评分方法,其特征在于,所述将所有词语与标准文本中的关键词逐一进行对比,获得关键词评分,具体包括:检测所有词语中包含所述关键词的个数,计算包含的个数与关键词总个数的比例,获得关键词覆盖率;从所有...

【专利技术属性】
技术研发人员:李心广李苏梅尹伟杰陈帅林泽聪廖燕敏欧阳柏超连梓炜杨志和刘婷龙晓岚
申请(专利权)人:广东外语外贸大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1