语音识别模型的训练方法、语音识别方法及相关装置制造方法及图纸

技术编号：42971520 阅读：23 留言：0更新日期：2024-10-15 13:13

本申请实施例提供了语音识别模型的训练方法、语音识别方法及相关装置，属于人工智能技术领域。该方法通过根据窗口的目标位置和目标大小从训练语音数据的词元中选择出目标词元，根据目标词元得到键；根据查询、键和值得到注意力特征；根据注意力特征进行分类得到预测文本数据；根据预测文本数据调整窗口的位置范围和大小范围得到训练好的语音识别模型；从窗口的位置范围内随机选择窗口的目标位置，从窗口的大小范围内随机选择窗口的目标大小，增加了模型的非线性能力，减少了计算开销和存储消耗，有利于模型处理长序列输入；能根据数据特点和任务要求调整窗口的大小和交互方式，提高模型在不同数据集和任务上的适应性和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及语音识别模型的训练方法、语音识别方法及相关装置。

技术介绍

1、在语音识别任务中，语音识别模型利用注意力机制聚焦于输入的语音数据的关键特征，提高语音识别模型的效率和准确性。在注意力机制中，需要对输入特征序列进行加权汇总，计算每对不同位置的词元之间的相关性得分。例如，对于一个长度为n的输入语音序列，注意力机制的空间复杂度和时间复杂度均为o(n^2)，因为需要存储所有位置间相关性得分的矩阵以及需要计算涉及所有位置间的相关性。例如，对于一个长度为100的输入序列，就需要存储一个100×100的相关性得分矩阵，其中共有10000个元素；并且需要进行10000次的相关性得分计算。对于更长的输入序列，这种空间复杂度和时间复杂度会呈平方增长，增加了内存消耗和降低了计算效率。空间复杂度和时间复杂度的增长限制了基于注意力机制的语音识别模型对于处理长序列语音数据的能力。当需要处理长序列语音数据时，内存需求和计算开销会变得非常高，从而降低了语音识别模型的可扩展性和计算效率。

技术实现思路

1、本申请实施本文档来自技高网...

【技术保护点】

1.一种语音识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的语音识别模型的训练方法，其特征在于，所述根据所述词元得到注意力机制的查询和值，包括：

3.根据权利要求1所述的语音识别模型的训练方法，其特征在于，所述根据所述目标词元得到注意力机制的键，包括：

4.根据权利要求1所述的语音识别模型的训练方法，其特征在于，所述根据所述查询、所述键和所述值得到注意力特征，包括：

5.根据权利要求4所述的语音识别模型的训练方法，其特征在于，第i个注意力分数对应的位置编码表示为：其中，PEi为第i个注意力分数对应的位置编码，k为大于或等于1...

【技术特征摘要】

1.一种语音识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的语音识别模型的训练方法，其特征在于，所述根据所述词元得到注意力机制的查询和值，包括：

3.根据权利要求1所述的语音识别模型的训练方法，其特征在于，所述根据所述目标词元得到注意力机制的键，包括：

4.根据权利要求1所述的语音识别模型的训练方法，其特征在于，所述根据所述查询、所述键和所述值得到注意力特征，包括：

5.根据权利要求4所述的语音识别模型的训练方法，其特征在于，第i个注意力分数对应的位置编码表示为：其中，pei为第i个注意力分数对应的位置编码，k为大于或等于1的正整数，d为训练语音数据的维度。

6.根据权...

【专利技术属性】
技术研发人员：郭洋，王健宗，程宁，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人