用于口语水平评测的方法、装置、电子设备以及介质制造方法及图纸

技术编号:21161204 阅读:50 留言:0更新日期:2019-05-22 08:22
本发明专利技术的实施方式提供了一种用于口语水平评测的方法,该方法包括:从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的第一语义相关度;根据所述第一语义相关度以及所述待评发音特征获取评分结果。解决了现有技术中根据题目文本与语音数据无法直接计算语义相关度的问题,本发明专利技术的方法可以使用户在互联网上进行口语测试或者考试,极大地增加了测试和考试效率,提高了用户体验。此外,本发明专利技术实施方式还提供了一种介质、用于口语水平评测的装置及电子设备。

Methods, devices, electronic devices and media for oral proficiency assessment

The embodiments of the present invention provide a method for oral proficiency assessment, which includes: random extraction of the subject to be tested from the question bank; acquisition of the speech data to be evaluated for the subject to be tested; acquisition of the corresponding text data to be evaluated and the pronunciation characteristics to be evaluated based on the speech data to be evaluated; acquisition of the first semantic phase between the text data to be evaluated and the subject to be tested. Relevance; score results are obtained according to the first semantic correlation and the pronunciation characteristics to be evaluated. The method solves the problem that the semantic correlation can not be calculated directly according to the topic text and voice data in the prior art. The method of the present invention can enable users to conduct oral test or examination on the Internet, greatly increasing the efficiency of test and examination, and improving the user experience. In addition, the embodiment of the present invention also provides a medium, a device for oral proficiency evaluation and an electronic device.

【技术实现步骤摘要】
用于口语水平评测的方法、装置、电子设备以及介质
本专利技术的实施方式涉及计算机辅助教育领域,更具体地,本专利技术的实施方式涉及用于口语水平评测的方法、装置、电子设备以及介质。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或者上下文。此处的描述不因为包括在本部分中就承认是现有技术。目前大多使用人工进行口语测评,但是人工评测具有以下缺点:1、打分较为主观:分数主要根据考官个人意愿评判,受个体差异较大。2、人力成本高:大部分人工口语测评均需要预约和集中进行,受时间、地域、人数和金钱成本等限制较大。3、专业性低:测试机构的评委和导师的专业资质及水平难以确保。4、效率低、重复性差:人工测评多为一对多或者少量评委面对大量考生,真正测评时间所占比例较低,同时考生并不能反复回顾自己的考题来对比评价结果。现在还有一种通过程序对用户语音进行评价分析的方法。
技术实现思路
但是,现有的程序测评具有以下特点或者不足:1、准确性不足:市面上的程序测评受到录音设备、环境、用户口音等的影响,对用户语音的识别成功率即准确率很低;大部分口音模考软件甚至仅依靠用户点赞来筛选优质回答(如图8所示)而不提供任何评价。2、评分维度单一:评分维度大部分仅针对语音长度和流利度做出评价,对用户发音、语法、停顿、词汇以及语义相关性等无法做出评价。3、评分效率低:评分过程效率低,从开始评分到生成评价报告的过程时间较长。4、分析内容匮乏:仅提供口语打分,而缺乏整体水平评价、口语水平横向对比评价、口语各维度评价、错题分析、标准读音以及提高方向等内容。另一方面,现有技术中的方法主要针对的是有标准参考答案的测试或者考试题目进行评分的,但在口语考试(例如雅思)中存在大量的主观性考题,这些主观性考题并没有标准参考答案,此时如何通过机器来实现打分就是一个亟待解决的技术难题。因此在现有技术中,针对没有标准参考答案的主观性口语试题如何实现机器评分以及如何从多个不同的评分维度实现对考生口语的综合评分和评价,这是非常令人烦恼的技术问题。为此,非常需要一种改进的用于口语水平评测的技术方案,本专利技术实施方式通过从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据;获取所述待评文本数据和所述待测题目之间的第一语义相关度,从而根据所述第一语义相关度获取评分结果。在本上下文中,本专利技术实施方式期望提供一种用于口语水平评测的方法、介质、装置以及电子设备。在本专利技术实施方式的第一方面中,提供了一种用于口语水平评测的方法,包括:从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的第一语义相关度;根据所述第一语义相关度以及所述待评发音特征获取评分结果。在本专利技术的一个实施例中,所述方法还包括:根据所述待测题目的类型获取相应的评测维度和评分标准。在本专利技术的再一个实施例中,所述评测维度包括语法评测维度和/或词汇量评测维度和/或发音评测维度和/或流利度评测维度,相应的所述评分标准包括语法评分标准和/或词汇量评分标准和/或发音评分标准和/或流利度评分标准,所述方法还包括:根据所述待评文本数据和所述语法评分标准获取语法评分;和/或根据所述待评文本数据和所述词汇量评分标准获取词汇量评分;和/或根据所述待评发音特征和所述发音评分标准获取发音评分;和/或根据所述待评发音特征和所述流利度评分标准获取流利度评分。在本专利技术的再一个实施例中,所述方法还包括:根据所述语法评分和/或所述词汇量评分和/或所述发音评分和/或所述流利度评分获取所述评分结果。在本专利技术的再一个实施例中,所述方法还包括:获取所述待评文本数据和所述待测题目的标准答案之间的第二语义相关度;根据所述第二语义相关度获取所述评分结果。在本专利技术的再一个实施例中,还包括:对所述评分结果进行分析获取分析结果;根据所述评分结果和所述分析结果生成综合评测报告。在本专利技术实施方式的第二方面中,提供了一种介质,其上存储有程序,该程序被处理器执行时实现上述方法实施方式中的各步骤,例如,从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的第一语义相关度;根据所述第一语义相关度以及所述待评发音特征获取评分结果。在本专利技术实施方式的第三方面中,提供一种用于口语水平评测的装置,包括:题目抽取模块,用于从题库随机抽取待测题目;语音采集模块,用于采集针对所述待测题目的待评语音数据;语音识别模块,用于根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;第一相关度计算模块,用于获取所述待评文本数据和所述待测题目之间的第一语义相关度;评分模块,用于根据所述第一语义相关度以及所述待评发音特征获取评分结果。在本专利技术的一个实施例中,所述装置还包括:维度标准获取模块,其用于根据所述待测题目的类型获取相应的评测维度和评分标准。在本专利技术的又一个实施例中,所述评测维度包括语法评测维度和/或词汇量评测维度和/或发音评测维度和/或流利度评测维度,相应的所述评分标准包括语法评分标准和/或词汇量评分标准和/或发音评分标准和/或流利度评分标准。其中,所述评分模块还包括语法评分单元和/或词汇量评分单元和/或发音评分单元和/或流利度评分单元。其中,所述语法评分单元用于根据所述待评文本数据和所述语法评分标准获取语法评分。所述词汇量评分单元用于根据所述待评文本数据和所述词汇量评分标准获取词汇量评分。所述发音评分单元用于根据所述待评发音特征和所述发音评分标准获取发音评分。所述流利度评分单元用于根据所述待评发音特征和所述流利度评分标准获取流利度评分。在本专利技术的再一个实施例中,所述评分模块还包括总评单元。其中,所述总评单元用于根据所述语法评分和/或所述词汇量评分和/或所述发音评分和/或所述流利度评分获取所述评分结果。在本专利技术的再一个实施例中,所述装置还包括第二相关度计算模块。其中所述第二相关度技术模块用于获取所述待评文本数据和所述待测题目的标准答案之间的第二语义相关度。其中所述评分模块还用于根据所述第二语义相关度获取所述评分结果。在本专利技术的再一个实施例中,所述装置还包括分析模块以及报告生成模块。其中,所述分析模块用于对所述评分结果进行分析获取分析结果。所述报告生成模块用于根据所述评分结果和所述分析结果生成综合评测报告。在本专利技术实施方式的第四方面中,提供一种电子设备,主要包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,下述指令被运行:从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的第一语义相关度;根据所述第一语义相关度以及所述待评发音特征获取评分结果。根据本专利技术实施方式提供的用于口语水平评测的方法、介质、装置以及电子设备,通过从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的本文档来自技高网...

【技术保护点】
1.一种用于口语水平评测的方法,包括:从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的第一语义相关度;根据所述第一语义相关度以及所述待评发音特征获取评分结果。

【技术特征摘要】
1.一种用于口语水平评测的方法,包括:从题库随机抽取待测题目;采集针对所述待测题目的待评语音数据;根据所述待评语音数据获取对应的待评文本数据以及待评发音特征;获取所述待评文本数据和所述待测题目之间的第一语义相关度;根据所述第一语义相关度以及所述待评发音特征获取评分结果。2.如权利要求1所述的方法,其中,还包括:根据所述待测题目的类型获取相应的评测维度和评分标准。3.如权利要求2所述的方法,其中,所述评测维度包括语法评测维度和/或词汇量评测维度和/或发音评测维度和/或流利度评测维度,相应的所述评分标准包括语法评分标准和/或词汇量评分标准和/或发音评分标准和/或流利度评分标准,所述方法还包括:根据所述待评文本数据和所述语法评分标准获取语法评分;和/或根据所述待评文本数据和所述词汇量评分标准获取词汇量评分;和/或根据所述待评发音特征和所述发音评分标准获取发音评分;和/或根据所述待评发音特征和所述流利度评分标准获取流利度评分。4.如权利要求3所述的方法,其中,还包括:根据所述语法评分和/或所述词汇量评分和/或所述发音评分和/或所述流利度评分获取所述评分结果。5.如权利要求1至4任一项所述的方法,其中,还包括:获取所述待评文本数据和所述待...

【专利技术属性】
技术研发人员:林晖
申请(专利权)人:上海流利说信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1