用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别技术方案

技术编号：18580848 阅读：31 留言：0更新日期：2018-08-01 14:52

用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别。使用经训练的监督机器学习模块，该监督机器学习模块使用训练集被训练，该训练集包括多个生产语音样本资产记录、由执行感知练习的系统用户生成的相关联的生产得分、以及用户背景信息。经训练的监督机器学习模块可以被配置用于通过馈送候选生产语音样本资产以使语音样本资产生产得分和用户背景信息的生成自动化来实现自动口音识别。这样，用户背景信息可以被转换为口音类型类别，并且语音样本资产生产得分可以被转换为口音强度。在另外的实施例中，使用经训练的系统生成的口音类型类别可以用于改进的语音识别。

The method, automatic accent recognition and quantization, and improved speech recognition for users of the distributed language learning system to automatically generate voice sample assets

The method, automatic accent recognition and quantization, and improved speech recognition for the users of the distributed language learning system. Using a trained supervised machine learning module, the supervised machine learning module is trained using a training set, which includes multiple production voice sample asset records, associated production scores generated by the system users performing perceptual practice, and user background information. The trained supervised machine learning module can be configured to produce voice sample assets through a feed candidate to automate automatic accent recognition by automating the production score of voice sample assets and the generation of user background information. In this way, user background information can be converted into accent type categories, and voice sample asset production scores can be converted into accent intensity. In other embodiments, an accent type class generated by trained systems can be used for improved speech recognition.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别
本专利技术涉及用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别。
技术实现思路
在本文中提供的实施例中，提供了一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法。具体地，该方法可以使用经训练的监督机器学习模块，该监督机器学习模块使用训练集被训练，该训练集包括多个生产语音样本资产记录、由执行感知练习的系统用户生成的相关联的生产得分、以及用户背景信息。一旦被训练，经训练的监督机器学习模块就可以被配置为在被提供候选生产语音样本资产记录和用户背景信息时使语音样本资产生产得分的生成自动化。在另外的实施例中，经训练的监督机器学习模块可以被配置用于自动化口音识别。具体地，经训练的监督机器学习模块可以被馈送候选生产语音样本资产以使语音样本资产生产得分和用户背景信息的生成自动化。这样，用户背景信息可以被转换为口音类型类别，并且语音样本资产生产得分可以被转换为口音强度。在另外的实施例中，使用经训练的系统生成的口音类型类别可以用于改进的语音识别，其中口音类型类别用于为语音识别模块选择适当的声学模型的目的。因此，考虑到前述内容，根据第一方面，提供了一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法，该方法包括：对于包括本地语音样本资产的多个语音样本资产，向多个非母语用户发送本地语音样本资产以执行生产练习；接收由生产练习生成的生产语音样本资产；向多个用户发送生产语音样本资产以执行感知练习；接...

【技术保护点】
1.一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法，所述方法包括：对于包括本地语音样本资产的多个语音样本资产：向多个非母语用户发送所述本地语音样本资产以执行生产练习；接收由所述生产练习生成的生产语音样本资产；向多个用户发送所述生产语音样本资产以执行感知练习；接收由所述感知练习生成的生产得分；训练监督机器学习模块，包括：生成训练集，所述训练集包括第一多个非母语用户的所述生产语音样本资产以及相关联的生产得分和相关联的用户背景信息；使用所述训练集训练所述监督机器学习模块以生成经训练的监督机器学习模块；以及对于非母语用户的候选生产语音样本资产，将所述非母语用户的候选生产语音样本资产和用户背景信息输入到所述经训练的监督机器学习模块中，以使所述候选生产语音样本资产的语音样本资产生产得分的生成自动化。

【技术特征摘要】
【国外来华专利技术】2015.09.22 AU 20159038561.一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法，所述方法包括：对于包括本地语音样本资产的多个语音样本资产：向多个非母语用户发送所述本地语音样本资产以执行生产练习；接收由所述生产练习生成的生产语音样本资产；向多个用户发送所述生产语音样本资产以执行感知练习；接收由所述感知练习生成的生产得分；训练监督机器学习模块，包括：生成训练集，所述训练集包括第一多个非母语用户的所述生产语音样本资产以及相关联的生产得分和相关联的用户背景信息；使用所述训练集训练所述监督机器学习模块以生成经训练的监督机器学习模块；以及对于非母语用户的候选生产语音样本资产，将所述非母语用户的候选生产语音样本资产和用户背景信息输入到所述经训练的监督机器学习模块中，以使所述候选生产语音样本资产的语音样本资产生产得分的生成自动化。2.根据权利要求1所述的方法，还包括扩展所述生产得分以降低评级漂移。3.根据权利要求1所述的方法，还包括根据所述生产得分计算感知得分。4.根据权利要求3所述的方法，其中，所述感知得分表示准确性。5.根据权利要求3所述的方法，其中，所述感知得分表示一致性。6.根据权利要求1所述的方法，其中，所述生产练习包括模仿生产练习。7.根据权利要求6所述的方法，其中，模仿生产练习包括单词模仿生产练习。8.根据权利要求6所述的方法，其中，所述模仿生产练习包括句子模仿生产练习。9.根据权利要求1所述的方法，其中，所述生产练习包括理解练习。10.根据权利要求1所述的方法，其中，所述感知练习包括根据反馈标度对记录的语音样本进行评级。11.根据权利要求10所述的方法，其中，所述反馈标度是数字评级标度。12.根据权利要求11所述的方法，其中，所述反馈标度是分类评级标度。13.根据权利要求1所述的方法，其中，所述生产得分包括与多个度量相关的生产得分。14.根据权利要求1所述的方法，其中，所述感知练习包括将所述生产语音样本资产与其他语音样本资产相比较。15.根据...

【专利技术属性】
技术研发人员：格雷戈里·卡萨尼，菲利普·沙普茨尼科，
申请(专利权)人：旺多姆咨询私人有限公司，
类型：发明
国别省市：澳大利亚,AU

全部详细技术资料下载我是这个专利的主人