【技术实现步骤摘要】
语音处理方法及装置、电子设备、计算机可读存储介质
本申请涉及人工智能
,具体涉及一种语音处理方法及装置、电子设备和计算机可读存储介质。
技术介绍
随着人工智能技术研究和进步,人工智能技术已在多个领域展开研究和应用,例如在常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、自动驾驶、无人机、机器人、智能客服等领域,人工智能技术发挥着越来越重要的价值。在开放式口语考试场景中,为方便地获得口语考试成绩,基于人工智能技术开发的智能评分系统应运而生,但如何提升智能评分系统进行评分的准确性,是本领域的技术人员需要不断研究的技术问题。
技术实现思路
为提升智能评分系统针对用户口语进行评分的准确性,本申请的实施例提供一种语音处理方法及装置,以及一种口语考试的评分方法及装置,还提供一种电子设备以及一种计算机可读存储介质。其中,本申请所采用的技术方案为:一种语音处理方法,包括:获取针对语音进行识别处理得到的声学参数和识别文本;根据所述声学参数提取所述语音的声学特征,并根据所述识别文本提取 ...
【技术保护点】
1.一种语音处理方法,其特征在于,包括:/n获取针对语音进行识别处理得到的声学参数和识别文本;/n根据所述声学参数提取所述语音的声学特征,并根据所述识别文本提取所述语音的文本特征;/n根据所述语音关联的得分点类型,将所述声学特征和所述文本特征输入至与所述得分点类型相匹配的评分预测模型中,得到所述评分预测模型根据所述声学特征、所述文本特征以及所述得分点类型输出的针对所述语音的评分值,不同的得分点类型所匹配的评分预测模型是不同的。/n
【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:
获取针对语音进行识别处理得到的声学参数和识别文本;
根据所述声学参数提取所述语音的声学特征,并根据所述识别文本提取所述语音的文本特征;
根据所述语音关联的得分点类型,将所述声学特征和所述文本特征输入至与所述得分点类型相匹配的评分预测模型中,得到所述评分预测模型根据所述声学特征、所述文本特征以及所述得分点类型输出的针对所述语音的评分值,不同的得分点类型所匹配的评分预测模型是不同的。
2.根据权利要求1所述的方法,其特征在于,根据所述识别文本提取所述语音的文本特征,包括:
在所述识别文本中检测不流利的文本成分;
去除所述识别文本中含有的所述不流利的文本成分,基于去除了所述不流利的文本成分的识别文本提取所述文本特征。
3.根据权利要求1或2所述的方法,其特征在于,在根据所述识别文本提取所述语音的文本特征之前,所述方法还包括:
在所述识别文本中添加标点符号,以基于添加了所述标点符号的识别文本进行所述文本特征的提取。
4.根据权利要求1所述的方法,其特征在于,根据所述声学参数提取所述语音的声学特征,包括:
根据所述声学参数确定所述语音中含有的各个音素的置信度;
对所述各个音素进行组合得到所述语音中含有的各个音素集合,并基于所述各个音素的置信度确定所述各个音素集合的置信度,将所述各个因素的置信度以及所述各个因素集合的置信度作为所述语音的声学特征。
5.根据权利要求1所述的方法,其特征在于,根据所述声学参数提取所述语音的声学特征,包括:
根据所述声学参数确定所述语音在发音过程中的时长参数;
根据所述时长参数确定所述语音的发音流利度,并将所述发音流利度作为所述语音的声学特征。
6.根据权利要求5所述的方法,其特征在于,所述发音流利度包括所述语音的平均语速、发音段平均时长和发音段平均间隔时长;根据所述时长参数确定所述语音的发音流利度,包括:
根据所述时长参数确定所述语音的发音总时长、所述语音中含有的各个发音段的发音时长、以及相邻两个发音段之间的间隔时长;
根据所述发音总时长和所述语音中含有的音素总数确定所述平均语速,并根据所述各个发音段的发音时长确定所述发音段平均时长,以及根据所述相邻两个发音段之间的间隔时长确定所述发音段平均间隔时长。
7.根据权利要求1所述的方法,其特征在于,所述声学特征包括所述语音对应的发音韵律度;根据所述声学参数提取所述语音的声学特征,包括:
将所述声学参数输入至韵律评估模型中,以获得所述韵律评估模型根据所述声学参数评估得到的所述语音对应的发音韵律度。
8.根据权利要求1所述的方法,其特征在于,根据所述识别文...
【专利技术属性】
技术研发人员:林炳怀,王丽园,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。