一种可快速定制唤醒词的语音唤醒方法及系统技术方案

技术编号:41858429 阅读:30 留言:0更新日期:2024-06-27 18:32
本发明专利技术公开了一种可快速定制唤醒词的语音唤醒方法及系统,属于数字信号处理,深度学习和安卓开发技术领域,包括:在电脑端,基于由特征提取器、尺度模块和CRNN模型组成的深度神经网络模型,使用开源中文语音数据集进行训练,得到嵌入模型;在安卓端,对嵌入模型进行部署,并在嵌入模型的输出端添加单层全连层,通过设置具有低维背景噪声特征的新唤醒词对单层全连层进行训练,构建唤醒模型;在安卓端,收集语音输入信息,通过唤醒模型,识别语音输入信息中的新唤醒词,并执行对应的语音喊醒功能。本发明专利技术基于迁移学习提出了快速定制唤醒词的方案,此方案简单可行,可部署在大量语音交互产品中,大大拓宽了语音产品市场。

【技术实现步骤摘要】

本专利技术涉及数字信号处理,深度学习和安卓开发,具体而言,涉及一种可快速定制唤醒词的语音唤醒方法及系统


技术介绍

1、语音唤醒是许多语音交互产品的前置环节,在用户使用语音交互产品之前,一般都需要通过特定的唤醒词,将设备或应用从待机状态唤醒,再进行后续的语音控制或语音识别。

2、在目前市场上,大多数的语音唤醒系统都有其预先设定的唤醒词,这些产品使用设定好的唤醒词,可能使个人设备被其他用户唤醒,带来信息安全问题,而且,这些唤醒词要求普通话发音标准,导致发音不准的人群难以有效使用语音交互产品。另外,用户不可根据自身喜好改变唤醒词,在一定程度上影响了用户体验。

3、近几年,语音行业的头部企业也推出了定制唤醒词业务,但该业务主要面向企业,成本较高,难以推广到大量产品中。此外,该业务仅限普通话唤醒词,如用户需定义小方言唤醒词(如潮汕话,温州话),其效果待验证,而这也进一步限制了定制唤醒词业务的推广。

4、语音唤醒的核心技术是语音识别(speech recognition),在这项技术中,计算机分析用户的语音输入并将其转换为文本。语本文档来自技高网...

【技术保护点】

1.一种可快速定制唤醒词的语音唤醒方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

3.根据权利要求2所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

4.根据权利要求3所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

5.根据权利要求4所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

6.根据权利要求5所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

7.根据权利要求6所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:p>

8.根据权...

【技术特征摘要】

1.一种可快速定制唤醒词的语音唤醒方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

3.根据权利要求2所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

4.根据权利要求3所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

5.根据权利要求4所述一种可快速定制唤醒词的语音唤醒方法,其特征在于:

【专利技术属性】
技术研发人员:黄梓铭曹海涛杨震伦
申请(专利权)人:广州番禺职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1