用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别技术方案

技术编号:18580848 阅读:31 留言:0更新日期:2018-08-01 14:52
用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别。使用经训练的监督机器学习模块,该监督机器学习模块使用训练集被训练,该训练集包括多个生产语音样本资产记录、由执行感知练习的系统用户生成的相关联的生产得分、以及用户背景信息。经训练的监督机器学习模块可以被配置用于通过馈送候选生产语音样本资产以使语音样本资产生产得分和用户背景信息的生成自动化来实现自动口音识别。这样,用户背景信息可以被转换为口音类型类别,并且语音样本资产生产得分可以被转换为口音强度。在另外的实施例中,使用经训练的系统生成的口音类型类别可以用于改进的语音识别。

The method, automatic accent recognition and quantization, and improved speech recognition for users of the distributed language learning system to automatically generate voice sample assets

The method, automatic accent recognition and quantization, and improved speech recognition for the users of the distributed language learning system. Using a trained supervised machine learning module, the supervised machine learning module is trained using a training set, which includes multiple production voice sample asset records, associated production scores generated by the system users performing perceptual practice, and user background information. The trained supervised machine learning module can be configured to produce voice sample assets through a feed candidate to automate automatic accent recognition by automating the production score of voice sample assets and the generation of user background information. In this way, user background information can be converted into accent type categories, and voice sample asset production scores can be converted into accent intensity. In other embodiments, an accent type class generated by trained systems can be used for improved speech recognition.

【技术实现步骤摘要】
【国外来华专利技术】用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别
本专利技术涉及用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别。
技术实现思路
在本文中提供的实施例中,提供了一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法。具体地,该方法可以使用经训练的监督机器学习模块,该监督机器学习模块使用训练集被训练,该训练集包括多个生产语音样本资产记录、由执行感知练习的系统用户生成的相关联的生产得分、以及用户背景信息。一旦被训练,经训练的监督机器学习模块就可以被配置为在被提供候选生产语音样本资产记录和用户背景信息时使语音样本资产生产得分的生成自动化。在另外的实施例中,经训练的监督机器学习模块可以被配置用于自动化口音识别。具体地,经训练的监督机器学习模块可以被馈送候选生产语音样本资产以使语音样本资产生产得分和用户背景信息的生成自动化。这样,用户背景信息可以被转换为口音类型类别,并且语音样本资产生产得分可以被转换为口音强度。在另外的实施例中,使用经训练的系统生成的口音类型类别可以用于改进的语音识别,其中口音类型类别用于为语音识别模块选择适当的声学模型的目的。因此,考虑到前述内容,根据第一方面,提供了一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法,该方法包括:对于包括本地语音样本资产的多个语音样本资产,向多个非母语用户发送本地语音样本资产以执行生产练习;接收由生产练习生成的生产语音样本资产;向多个用户发送生产语音样本资产以执行感知练习;接收由感知练习生成的生产得分;训练监督机器学习模块,包括:生成训练集,训练集包括第一多个非母语用户的生产语音样本资产以及相关联的生产得分和相关联的用户背景信息;使用所述训练集训练监督机器学习模块以生成经训练的监督机器学习模块;以及对于非母语用户的候选生产语音样本资产,将非母语用户的候选生产语音样本资产和用户背景信息输入到经训练的监督机器学习模块中,以使候选生产语音样本资产的语音样本资产生产得分的生成自动化。该方法还可以包括扩展生产得分以降低评级漂移。该方法还可以包括根据生产得分计算感知得分。感知得分表示准确性。感知得分表示一致性。生产练习可以包括模仿生产练习。模仿生产练习可以包括单词模仿生产练习。模仿生产练习可以包括句子模仿生产练习。生产练习可以包括理解练习。感知练习可以包括根据反馈标度对记录的语音样本进行评级。反馈标度可以是数字评级标度。反馈标度可以是分类评级标度。生产得分可以包括与多个度量相关的生产得分。感知练习可以包括将生产语音样本资产与其他语音样本资产相比较。计算感知得分可以包括将生产得分与用户的生产语音样本资产的至少一个其他生产得分相比较。计算感知得分可以包括使用统计技术。统计技术可以包括钟形曲线拟合。用户背景信息可以包括母语、原籍国和居住国中的至少一项。该方法还可以用于自动口音识别和量化,该方法包括:将候选生产语音样本资产输入到经训练的监督机器学习模块中以生成语音样本资产生产得分和非母语用户的用户背景信息;将用户背景信息转换为口音类型类别;以及将语音样本资产生产得分转换为口音强度。经训练的监督机器学习模块可以使用回归来生成语音样本资产生产得分。经训练的监督机器学习模块可以使用分类来生成用户背景信息。用户背景信息可以包括母语、原籍国和居住国中的至少一项。该方法还可以用于改进的语音识别,该方法包括:对于语音识别模块,根据口音类型类别来选择声学模型。该方法还可以包括:对于语音识别模块,根据口音类型和强度来选择和组合多个声学模型。语音识别模块可以是隐马尔可夫模型语音识别模块。该方法还可以用于改进的语音识别,该方法包括:对于语音识别模块,根据口音类型类别和候选生产语音样本资产来训练语音识别模块。语音识别模块可以是人工神经网络语音识别模块。该方法还可以用于改进的语音识别,该方法包括:根据相应的多个口音来训练多个语音识别模块,并且根据口音类型类别来选择所述多个语音识别模块中的一个。语音识别模块可以是人工神经网络语音识别模块。本专利技术的其他方面也被公开。附图说明尽管存在可以落入本专利技术的范围内的任何其他形式,但是现在将仅通过示例的方式参考附图来描述本公开的优选实施例,在附图中:图1示出了根据本公开的实施例的用于分布式语言学习系统的用户的语音样本资产生产得分的自动生成、自动口音识别和量化、以及改进的语音识别;图2示出了根据本公开的实施例的用于比较两个语音样本资产的示例性方法;图3示出了根据本公开的实施例的由语音样本资产排序模块实现的示例性用例场景;图4示出了根据本公开的实施例的作为资产A和B之间的评级得分差值的函数的期望值;图5示出了根据本公开的实施例的适合于被评估资产的使用具有5个分段的分段线性函数进行的评级拉伸;图6示出了根据本公开的实施例的监督机器学习模块的训练;图7示出了根据本公开的实施例的用于自动生成语音样本资产生产得分的经训练的监督机器学习模块;图8示出了根据本公开的实施例的用于自动标识口音类型类别和口音强度的经训练的监督机器学习模块;图9示出了根据本公开的实施例的用于改进语音识别系统的口音类型类别;图10示出了根据本公开的实施例的用于选择语音识别系统的声学模型的口音类型类别;以及图11示出了根据本公开的实施例的用于不同口音的语音识别的人工神经网络。具体实施方式为了促进对根据本公开的原理的理解,现在将参考在附图中示出的实施例,并且将使用特定的语言来描述这些实施例。然而应当理解,并非由此意在限制本公开的范围。本文所示的专利技术性特征的任何改变和另外的修改以及本文说明的本公开的原理的任何附加应用(其对相关领域的技术人员而言通常会发生并且涵盖本公开)将被认为在本公开的范围内。在与用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法相关的结构、系统和相关联的方法之前,公开和描述了自动口音识别和量化以及改进的语音识别,应当理解,本公开不限于本文中公开的特定的配置、处理步骤和材料,因为这些可以稍微变化。还应当理解,本文中使用的术语仅用于描述具体实施例的目的,并非意在限制,因为本公开的范围将仅由权利要求及其等同方案限制。在描述和要求保护本公开的主题时,将根据下面给出的定义来使用以下术语。必须注意,如本说明书和所附权利要求中使用的,除非上下文另外明确指出,否则单数形式“一个(a)”、“一个(an)”和“该(the)”包括复数指示物。如本文中使用的,术语“包括(comprising)”、“包含(including)”、“含有(containing)”、“特征在于”及其语法等同词汇是包括性的或开放式的术语,其不排除另外的未列举的要素或方法步骤。应当注意,在以下描述中,在不同实施例中的相似或相同的附图标记表示相同或相似的特征。概述在下面的实施例中,将描述用于改进非母语者的自动语音识别的系统1。具体地,转到图1,示出了系统1,其包括四个主要功能模块或其子集。具体地,并且如将在下面进一步详细描述的,系统1包括被配置用于对语音样本资产进行排序的语音样本资产排序模块2。模块2还可以被称为分布式语言学习系统2,因为用户15使用系统2执行生产和感知练习,使得系统2能本文档来自技高网...

【技术保护点】
1.一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法,所述方法包括:对于包括本地语音样本资产的多个语音样本资产:向多个非母语用户发送所述本地语音样本资产以执行生产练习;接收由所述生产练习生成的生产语音样本资产;向多个用户发送所述生产语音样本资产以执行感知练习;接收由所述感知练习生成的生产得分;训练监督机器学习模块,包括:生成训练集,所述训练集包括第一多个非母语用户的所述生产语音样本资产以及相关联的生产得分和相关联的用户背景信息;使用所述训练集训练所述监督机器学习模块以生成经训练的监督机器学习模块;以及对于非母语用户的候选生产语音样本资产,将所述非母语用户的候选生产语音样本资产和用户背景信息输入到所述经训练的监督机器学习模块中,以使所述候选生产语音样本资产的语音样本资产生产得分的生成自动化。

【技术特征摘要】
【国外来华专利技术】2015.09.22 AU 20159038561.一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法,所述方法包括:对于包括本地语音样本资产的多个语音样本资产:向多个非母语用户发送所述本地语音样本资产以执行生产练习;接收由所述生产练习生成的生产语音样本资产;向多个用户发送所述生产语音样本资产以执行感知练习;接收由所述感知练习生成的生产得分;训练监督机器学习模块,包括:生成训练集,所述训练集包括第一多个非母语用户的所述生产语音样本资产以及相关联的生产得分和相关联的用户背景信息;使用所述训练集训练所述监督机器学习模块以生成经训练的监督机器学习模块;以及对于非母语用户的候选生产语音样本资产,将所述非母语用户的候选生产语音样本资产和用户背景信息输入到所述经训练的监督机器学习模块中,以使所述候选生产语音样本资产的语音样本资产生产得分的生成自动化。2.根据权利要求1所述的方法,还包括扩展所述生产得分以降低评级漂移。3.根据权利要求1所述的方法,还包括根据所述生产得分计算感知得分。4.根据权利要求3所述的方法,其中,所述感知得分表示准确性。5.根据权利要求3所述的方法,其中,所述感知得分表示一致性。6.根据权利要求1所述的方法,其中,所述生产练习包括模仿生产练习。7.根据权利要求6所述的方法,其中,模仿生产练习包括单词模仿生产练习。8.根据权利要求6所述的方法,其中,所述模仿生产练习包括句子模仿生产练习。9.根据权利要求1所述的方法,其中,所述生产练习包括理解练习。10.根据权利要求1所述的方法,其中,所述感知练习包括根据反馈标度对记录的语音样本进行评级。11.根据权利要求10所述的方法,其中,所述反馈标度是数字评级标度。12.根据权利要求11所述的方法,其中,所述反馈标度是分类评级标度。13.根据权利要求1所述的方法,其中,所述生产得分包括与多个度量相关的生产得分。14.根据权利要求1所述的方法,其中,所述感知练习包括将所述生产语音样本资产与其他语音样本资产相比较。15.根据...

【专利技术属性】
技术研发人员:格雷戈里·卡萨尼菲利普·沙普茨尼科
申请(专利权)人:旺多姆咨询私人有限公司
类型:发明
国别省市:澳大利亚,AU

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1