一种口语练习自动评测方法及装置制造方法及图纸

技术编号:20330179 阅读:34 留言:0更新日期:2019-02-13 06:23
本发明专利技术适用于音频处理技术领域,提供了一种口语练习自动评测方法及装置,包括:获取标准口语文件以及与所述标准口语文件对应的练习音频;提取所述标准口语文件的第一语音韵律信息;提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括所述练习音频的第二语音韵律信息;根据所述第一语音韵律信息及所述第二语音韵律信息,分析所述练习音频的不流利因素;标记所述练习音频中所述不流利因素的位置及反馈信息,输出第一反馈音频。本发明专利技术实施例能够提高口语训练效率。

【技术实现步骤摘要】
一种口语练习自动评测方法及装置
本专利技术属于音频处理
,尤其涉及一种口语练习自动评测方法及装置。
技术介绍
现有的口语自动评测技术主要通过海量语料训练的声学模型和语言模型,通过学习教师的评分策略建立的统计模型来预测人工评分,以文字或图表等形式反馈给学习者。上述方法,单纯地通过预测人工评分的方式不能完整具体地反映学习者细节上的表现和口语能力的全貌,口语训练效率低。
技术实现思路
有鉴于此,本专利技术实施例提供了一种口语练习自动评测方法及装置,以解决现有技术中口语训练效率低的问题。本专利技术实施例的第一方面提供了一种口语练习自动评测方法,包括:获取标准口语文件以及与所述标准口语文件对应的练习音频;提取所述标准口语文件的第一语音韵律信息;提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括所述练习音频的第二语音韵律信息;根据所述第一语音韵律信息及所述第二语音韵律信息,分析所述练习音频的不流利因素;标记所述练习音频中所述不流利因素的位置及反馈信息,输出第一反馈音频。本专利技术实施例的第二方面提供了一种口语练习自动评测装置,包括:第一获取单元,用于获取标准口语文件以及与所述标准口语文件对应的练习音频;第一提取单元,用于提取所述标准口语文件的第一语音韵律信息;第二提取单元,用于提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括所述练习音频的第二语音韵律信息;分析单元,用于根据所述第一语音韵律信息及所述第二语音韵律信息,分析所述练习音频的不流利因素;第一输出单元,用于标记所述练习音频中所述不流利因素的位置及反馈信息,输出第一反馈音频。本专利技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述口语练习自动评测方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述口语练习自动评测方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例中,由于分析一整段口语练习音频中的不流利因素,并标记出在一整段练习音频中具体不流利之处并给出反馈信息,输出第一反馈音频,因此可以反映学习者在一整个口语练习中细节上的表现,完整具体地地反馈口语评测结果,使得学习者可以直观地了解自己具体需要改进的地方,提高口语训练效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的第一种口语练习自动评测方法的实现流程示意图;图2是本专利技术实施例提供的第二种口语练习自动评测方法的实现流程示意图;图3是本专利技术实施例提供的一种口语练习自动评测装置的示意图;图4是本专利技术实施例提供的终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。实施例一:图1示出了本申请实施例提供的第一种口语练习自动评测方法的流程示意图,详述如下:在S101中,获取标准口语文件以及与所述标准口语文件对应的练习音频。接收指令,获取标准口语文件,所述口语文件可以包括标准发音视频文件或者标准发音音频文件。获取与所述标准口语文件对应的练习音频,即学习者模仿所述标准口语文件而录制的练习音频。在S102中,提取所述标准口语文件的第一语音韵律信息。提取所述标准口语文件的第一语音韵律信息,可以用通过机器学习预先训练好的第一音频提取模型提取所述标准口语文件的第一语音韵律信息。可选地,所述第一语音韵律信息包括所述标准口语文件中的语音节奏、语调、音长信息。提取标准口语文件中音频的语音节奏、语调、音长等信息。其中语音节奏包括音频中的发音停顿位置、语调包括音调高低,音长包括每个词需要延续的发音时间。在S103中,提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括所述练习音频的第二语音韵律信息。提取练习音频的特征信息,可以用通过机器学习预先训练好的第二音频提取模块来提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括练习音频的第二语音韵律信息。可选地,所述第二语音韵律信息包括所述练习音频中的语音节奏、语调、音长信息。提取练习音频中音频的语音节奏、语调、音长等信息。其中语音节奏包括音频中的发音停顿位置、语调包括音调高低,音长包括每个词需要延续的发音时间。在S104中,根据所述第一语音韵律信息及所述第二语音韵律信息,分析所述练习音频的不流利因素。以第一语音韵律信息为标准,将第二语音韵律信息与第一语音韵律信息进行分析比对,找出练习音频的不流利因素。可以用机器学习算法训练出的比对模型,自动诊断出练习音频中与标准音频语音韵律的差距之处,得出不流利因素,所述不流利因素包括语音节奏过快、过慢,语音音调过高、过低,音长过长、过短等。具体地,可以设置节奏容错阈值、音调容错阈值、音长容错阈值等来判断不流利因素。以判断不流利因素中的语音音长为例,设置音长容错阈值为2秒,比较第二语音韵律信息与第一语音韵律信息,若第二语音韵律信息中的某个语音音长比第一语音韵律信息长2秒,则判定所述音长过长,反馈音长过长的不流利因素;若第二语音韵律信息中的某个语音音长比第一语音韵律信息短2秒,则判定所述音长过短,反馈音长过短的不流利因素。在S105中,标记所述练习音频中所述不流利因素的位置及反馈信息,输出第一反馈音频。标记S104中分析出的不流利因素在所述练习音频中的位置,该位置可通过所述练习音本文档来自技高网...

【技术保护点】
1.一种口语练习自动评测方法,其特征在于,包括:获取标准口语文件以及与所述标准口语文件对应的练习音频;提取所述标准口语文件的第一语音韵律信息;提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括所述练习音频的第二语音韵律信息;根据所述第一语音韵律信息及所述第二语音韵律信息,分析所述练习音频的不流利因素;标记所述练习音频中所述不流利因素的位置及反馈信息,输出第一反馈音频。

【技术特征摘要】
1.一种口语练习自动评测方法,其特征在于,包括:获取标准口语文件以及与所述标准口语文件对应的练习音频;提取所述标准口语文件的第一语音韵律信息;提取所述练习音频的特征信息,其中,所述练习音频的特征信息包括所述练习音频的第二语音韵律信息;根据所述第一语音韵律信息及所述第二语音韵律信息,分析所述练习音频的不流利因素;标记所述练习音频中所述不流利因素的位置及反馈信息,输出第一反馈音频。2.如权利要求1所述的口语练习自动评测方法,其特征在于,所述第一语音韵律信息包括所述标准口语文件中的语音节奏、语调、音长信息;所述第二语音韵律信息包括所述练习音频中的语音节奏、语调、音长信息。3.如权利要求1所述的口语练习自动评测方法,其特征在于,所述练习音频的特征信息还包括所述练习音频的音色信息,此时,在所述标记所述练习音频中所述不流利因素的位置及反馈信息,输出反馈音频之后,还包括:根据所述标准口语文件及所述练习音频的音色信息,输出第二反馈音频。4.如权利要求3所述的口语练习自动评测方法,其特征在于,所述根据所述标准口语文件及所述练习音频的音色信息,输出第二反馈音频,包括:根据所述标准口语文件及所述练习音频的音色信息,合成与所述练习音频的音色相同的第一标准音频;输出所述第一标准音频。5.如权利要求3所述的口语练习自动评测方法,其特征在于,所述根据所述标准口语文件及所述练习音频的音色信息,输出第二反馈音频,包括:根据所述标准口语文件及所述练习音频的音色信息,获取预存的标准音频中...

【专利技术属性】
技术研发人员:罗德安张春晓夏林中
申请(专利权)人:深圳信息职业技术学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1