当前位置: 首页 > 专利查询>鹏城实验室专利>正文

命令词识别方法、设备及计算机存储介质技术

技术编号:28041864 阅读:31 留言:0更新日期:2021-04-09 23:25
本发明专利技术公开了一种命令词识别方法、设备及计算机存储介质,该方法包括以下步骤:基于SincNet提取声纹特征向量以及命令词特征向量;分别对所述声纹特征向量以及所述命令词特征向量使用改进后的三元组损失函数进行训练;基于特征检索数据库对所述声纹特征向量进行检索匹配;基于所述特征检索数据库对所述命令词特征向量进行检索匹配;当所述声纹特征向量满足第一预设阈值,且所述命令词特征向量满足第二预设阈值,则识别成功。本发明专利技术解决了命令词识别效果差及响应速度慢的问题,提高命令词识别效果及识别速度。

【技术实现步骤摘要】
命令词识别方法、设备及计算机存储介质
本专利技术涉及语音识别领域,尤其涉及一种命令词识别方法、设备及计算机存储介质。
技术介绍
声纹识别与语音识别在语音使用领域变得越来越重要,尤其物联网的出现,使得人工智能的应用场景得到进一步的提升,因此对语音识别的安全提出了挑战。在命令词识别的任务中,命令词识别中面临着使用安全的挑战,一个未经判断使用者身份的工业系统常常更容易遭受到攻击和滥用。系统的响应速度较低会降低用户体验感;同时也会给系统带来损害,例如紧急设备系统未能及时关闭会导致设备故障。原因一般为,1)特征向量检索较慢;2)当前的语音模型大多以句子为单位,这导致了模型参数量过大,也是响应速度较低的原因。在一些大型的系统中,常常会有数十万的人员和上百万种的自定义命令。一般的特征向量检索方法较慢,从而降低响应速度。
技术实现思路
有鉴于此,提供一种命令词识别方法,解决命令词识别效果差及响应速度慢的问题。本申请实施例提供了一种命令词识别方法,所述方法包括:基于SincNet提取声纹特征向量以及命令本文档来自技高网...

【技术保护点】
1.一种命令词识别方法,其特征在于,所述方法包括:/n基于SincNet提取声纹特征向量以及命令词特征向量;/n分别对所述声纹特征向量以及所述命令词特征向量使用改进后的三元组损失函数进行训练;其中所述改进后的三元组损失函数为负数时仍能训练;/n基于特征检索数据库对所述声纹特征向量进行检索匹配;/n基于所述特征检索数据库对所述命令词特征向量进行检索匹配;/n当所述声纹特征向量满足第一预设阈值,且所述命令词特征向量满足第二预设阈值,则识别成功。/n

【技术特征摘要】
1.一种命令词识别方法,其特征在于,所述方法包括:
基于SincNet提取声纹特征向量以及命令词特征向量;
分别对所述声纹特征向量以及所述命令词特征向量使用改进后的三元组损失函数进行训练;其中所述改进后的三元组损失函数为负数时仍能训练;
基于特征检索数据库对所述声纹特征向量进行检索匹配;
基于所述特征检索数据库对所述命令词特征向量进行检索匹配;
当所述声纹特征向量满足第一预设阈值,且所述命令词特征向量满足第二预设阈值,则识别成功。


2.如权利要求1所述的命令词识别方法,其特征在于,所述基于SincNet提取声纹特征向量以及命令词特征向量,包括:
基于SincNet提取语音特征;
根据所述语音特征,利用预设层数依次叠加的残差网络,生成所述声纹特征向量以及所述命令词特征向量。


3.如权利要求2所述的命令词识别方法,其特征在于,所述SincNet的计算公式如下:
O[n]=x[n]*g[n,θ];



g[n,f1,f2]=2f2*sinc(2πf2n)-2f1*sinc(2πf1n);
sinc=sin(x)/x;
其中O函数为卷积函数,g函数为矩形通滤波器,θ为可训练参数;记G为g在频域空间的形式,G通过逆傅里叶变换转换为时域的形式;f为语音的原始频率,f1为低截止频率,f2为高截止频率,f1与f2均为可学习变量。


4.如权利要求1所述的命令词识别方法,其特征在于,所述分别对所述声纹特征向量以及所述命令词特征向量使用改进后的三元组损失函数进行训练,包括:
保存每一段语音对应的所述声纹特征向量以及所述命令词特征向量;
采用锚点的特征向量和正样本距离最远的样本特征向量以及采用所述锚点的特征向量和负样本距离最近的样本特征向量用于训练。


5.如权利要求4所述的命令词识别方法,其特征在于,所述采用锚点的特征向量和所述正样本距离最远的样本特征向量以及采用所述的特征向量和所述负样本距离最近的样本特征向量用于训练的公式如下:
记Av为所述锚点的特征向量组,Pv为所述正样本的特征向量组,Nv为所述负样本的特征向量组;则:
distance(Av,Pv)=Av*Pv;
distance(Av,Nv)=Av*Nv;
diff=distance(Av,Pv)-distance(Av,Nv)+margin;

a~U(l,u),l<uandl,u∈[0,1).
其中所述锚点为同一类内的样本;所述正样本为与锚点同一类的样本,所述负样本为与锚点不同类的样本;distance采用mse(c,d)=(c-d)2;margin为自定义的一个阈值;a为可学习参数,U(l,u)服从...

【专利技术属性】
技术研发人员:束建钢黄炜张伟哲卢梓杰黄树佳
申请(专利权)人:鹏城实验室
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1