System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于语义理解的离线语音命令词存储方法技术_技高网

一种基于语义理解的离线语音命令词存储方法技术

技术编号:41206837 阅读:3 留言:0更新日期:2024-05-07 22:33
一种基于语义理解的离线语音命令词存储方法,属于语音识别技术领域,包括如下步骤。步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词对应的语义标签,标记命令词的类型;步骤2:对每一最小功能词文本,罗列全部功能泛化词;步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储,步骤4:语音设备识别出功能泛化词,执行最小功能词文本对应的语音命令。本发明专利技术所述提升基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。

【技术实现步骤摘要】

本专利技术属于语音识别,具体涉及一种基于语义理解的离线语音命令词存储方法


技术介绍

1、基于语音识别设备本地离线命令词的语音识别,因受本地资源的限制,通常仅支持1000条以下命令词的识别,而在做语言模型时,语音的输入和文本的输出是一一对应的,如表1:

2、表1 现有技术命令词输入输出表

3、 语义标签 输入 输出 命令词类型 1 智能管家 智能管家 唤醒词 2 打开风扇 打开风扇 命令词 2 开启风扇 开启风扇 命令词 3 关闭风扇 关闭风扇 命令词 3 关掉风扇 关掉风扇 命令词

4、随着识别算法的迭代更新,基于语义理解的离线识别模型可支持的词条更多,通常比离线命令词模型多出数量级,可以轻松识别数万或数十万的命令词,离线识别模型增加命令词识别的好处在于:对同一个语义的命令词,可以做更多的说法;如,“打开风扇”有如下多种说法:打开风扇、开启风扇、启动风扇、开下风扇、请打开风扇、请开启风扇、请启动风扇、请开下风扇、帮我打开风扇、帮我开启风扇、帮我启动风扇、帮我开下风扇等。但同时也引入了新的问题:可识别命令词的增加,对应命令词的输出也会增加,从而使内存的消耗增加,一定程度上又影响了命令词的持续增加。


技术实现思路

1、针对上述现有技术存在的缺陷,本专利技术公开了一种基于语义理解的离线语音命令词存储方法。

2、本专利技术所述基于语义理解的离线语音命令词存储方法,包括如下步骤:

3、步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词文本对应的语义标签,标记命令词的类型;命令词的类型包括唤醒词和常规命令词;

4、步骤2:对每一最小功能词文本,根据预设的罗列规则罗列全部功能泛化词,

5、功能泛化词,是表达形式与最小功能词文本可能不同,但含义完全相同的词;

6、每个功能泛化词,划分为一个或多个分词的组合形式;

7、罗列规则包括:

8、规则1:对唤醒词,设置唯一的与最小功能词文本完全相同的功能泛化词;

9、规则2:设置组合符号,表示一个完整的分词组合,组合符号内可定义有输出分词,以输出分词作为最小功能词的部分文本输出,一般选择第一个分词;

10、规则3:设置“或”符号,表示可替换词,在分词组合内部使用时表示相互可替换的分词;

11、规则4:设置前后缀符号,表示可忽略的分词;

12、步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储。

13、步骤4:语音设备在听到用户发出的语音命令时,识别出语音命令文本后,与功能泛化词比对,完全相同的则找到对应的最小功能词文本,执行该最小功能词文本对应的语音命令。

14、优选的,所述步骤1中,命令词的类型还包括负性词;

15、所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。

16、优选的,所述步骤2中,设置规则6:设置特别定义符号,定义特殊功能泛化词。

17、优选的,所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。

18、优选的,所述步骤3中,单独利用或符号罗列出功能泛化词。

19、本专利技术所述提升基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,根据不同的句型或局式对输出进行归一,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。

本文档来自技高网...

【技术保护点】

1.一种基于语义理解的离线语音命令词存储方法,其特征在于,包括如下步骤:

2.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤1中,命令词的类型还包括负性词;所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。

3.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤2中,设置规则6:设置特别定义符号,定义特殊功能泛化词。

4.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。

5.如权利要求4所述的离线语音命令词存储方法,其特征在于,所述步骤3中,单独利用或符号罗列出功能泛化词。

【技术特征摘要】

1.一种基于语义理解的离线语音命令词存储方法,其特征在于,包括如下步骤:

2.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤1中,命令词的类型还包括负性词;所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。

3.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤2中...

【专利技术属性】
技术研发人员:陈思应何云鹏
申请(专利权)人:成都启英泰伦科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1