一种基于有限状态机的自定义语音唤醒词检测方法技术

技术编号：44818302 阅读：38 留言：0更新日期：2025-03-28 20:06

本发明专利技术公开了一种基于有限状态机的自定义语音唤醒词检测方法，包括如下步骤：利用互联网上的开源中文语音数据集训练Transformer网络模型；对输入的语音信号进行分帧加窗处理，并提取对应的特征；将提取的特征输入到Transformer网络模型中，生成帧概率张量；配置目标唤醒词内容并获得目标唤醒词对应的声韵母拼音序列，并构建有限状态机解码网络；对帧概率张量进行处理生成新的帧概率张量；将新的帧概率张量输入有限状态机解码网络，运行维特比算法，搜索最优音素路径；计算所有音素状态得分的平均值，与预设门限值进行比较，当超过时激活唤醒词。本发明专利技术结合Transformer模型和有限状态机技术，实现自定义语音唤醒词检测，具备灵活配置、低功耗运行、高精度和强鲁棒性的优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，尤其涉及一种基于有限状态机的自定义语音唤醒词检测方法。

技术介绍

1、随着人工智能技术的发展，语音识别技术已经成为智能设备的重要组成部分。作为语音识别系统的入口，语音唤醒功能能够通过特定的唤醒词启动设备，避免连续监听导致的资源浪费和隐私问题。这种功能广泛应用于智能音箱、车载系统、移动设备等领域，实现了人机自然交互。然而，现有的语音唤醒技术在多样化需求、性能优化以及可扩展性方面仍然面临挑战。

2、现有技术中，常见的语音唤醒方法主要依赖深度学习模型对语音信号进行分类。这些方法通过神经网络模型对每帧语音的特征进行分类，判断是否符合目标唤醒词的特定模式。语音特征的提取通常采用mfcc、filterbank或对数mel谱等方式，这些特征能够有效捕捉语音信号的频谱特性。然而，大多数现有技术采用的是直接对特定唤醒词进行训练的单一模型，即每次需要支持新的唤醒词时，必须重新训练声学模型。这种方法不仅耗费大量的时间和计算资源，而且对于用户来说缺乏灵活性。

3、此外，现有的语音唤醒系统往往受限于资源消耗和运行效...

【技术保护点】

1.一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述S1具体包括：

3.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述S2具体包括：

4.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述S3具体包括：

5.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述S4具体包括：

6.根据权利要求1所述的一种基于有限状态机的自定...

【技术特征摘要】

1.一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述s1具体包括：

3.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述s2具体包括：

4.根据权利要求1所述的一种基于有限状态机的自定义语音唤醒词检测方法，其特征在于，所述s3具体包括：

5.根...

【专利技术属性】
技术研发人员：许苏魁，
申请(专利权)人：安徽信息工程学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人