热词抑制制造技术

技术编号:26896457 阅读:43 留言:0更新日期:2020-12-29 16:24
公开了用于抑制热词的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,一种方法包括接收与话语的回放相对应的音频数据的动作。所述动作进一步包括将音频数据提供作为模型的输入,该模型(i)被配置成确定给定音频数据样本是否包括音频水印,并且(ii)使用均包括音频水印样本的加水印的音频数据样本和均不包括音频水印样本的未加水印的音频数据样本来训练。动作进一步包括从模型接收指示音频数据是否包括音频水印的数据。动作进一步包括基于指示音频数据是否包括音频水印的数据来确定继续或停止对音频数据的处理。

【技术实现步骤摘要】
【国外来华专利技术】热词抑制相关申请的交叉引用本申请要求2019年5月21日提交的美国申请No.16/418,415的权益,该美国申请No.16/418,415要求2018年5月22日提交的美国申请No.62/674,973的权益,两者的内容通过引用合并于此。
本公开总体上涉及自动语音处理。
技术介绍
启用语音的家庭或其他环境的现实——也就是说,其中用户仅需大声讲出查询或命令并且基于计算机的系统将应付并回答该查询和/或使命令被执行的环境——即将来临。可以使用分布在环境的各个房间或区域中的连接的麦克风设备的网络来实现启用语音的环境(例如,家庭、工作场所、学校等)。通过这样的麦克风的网络,用户基本上有权力从环境中的任何地方对系统进行口头查询,而无需在他/她的面前或者甚至附近拥有计算机或其他设备。例如,在厨房烹饪时,用户可能会询问系统“howmanymillilitersinthreecups(三杯中有多少毫升)?”并且作为响应,例如从系统接收以合成话音输出的形式的答案。可替代地,用户可以询问系统问题,诸如“whendoesmynearestgassta本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,包括:/n由计算设备接收与话语的回放相对应的音频数据;/n由所述计算设备提供所述音频数据作为模型的输入,所述模型(i)被配置成确定给定音频数据样本是否包括音频水印并且(ii)使用均包括音频水印样本的加水印的音频数据样本和均不包括音频水印样本的未加水印的音频数据样本来训练;/n由所述计算设备并且从所述模型接收指示所述音频数据是否包括所述音频水印的数据,所述模型(i)被配置成确定所述给定音频数据样本是否包括所述音频水印并且(ii)使用均包括所述音频水印的所述加水印的音频数据样本和均不包括所述音频水印的所述未加水印的音频数据样本来训练;以及/n基于指示所述音频数据是否包括所...

【技术特征摘要】
【国外来华专利技术】20180522 US 62/674,973;20190521 US 16/418,4151.一种计算机实现的方法,包括:
由计算设备接收与话语的回放相对应的音频数据;
由所述计算设备提供所述音频数据作为模型的输入,所述模型(i)被配置成确定给定音频数据样本是否包括音频水印并且(ii)使用均包括音频水印样本的加水印的音频数据样本和均不包括音频水印样本的未加水印的音频数据样本来训练;
由所述计算设备并且从所述模型接收指示所述音频数据是否包括所述音频水印的数据,所述模型(i)被配置成确定所述给定音频数据样本是否包括所述音频水印并且(ii)使用均包括所述音频水印的所述加水印的音频数据样本和均不包括所述音频水印的所述未加水印的音频数据样本来训练;以及
基于指示所述音频数据是否包括所述音频水印的所述数据,由所述计算设备确定继续或者停止对所述音频数据的处理。


2.根据权利要求1所述的方法,其中:
接收指示所述音频数据是否包括所述音频水印的所述数据包括:接收指示所述音频数据包括所述音频水印的所述数据,
确定继续或停止对所述音频数据的处理包括:基于接收到指示所述音频数据包括所述音频水印的所述数据来确定停止对所述音频数据的处理,并且
所述方法进一步包括:基于确定停止对所述音频数据的处理,由所述计算设备停止对所述音频数据的处理。


3.根据权利要求1所述的方法,其中:
接收指示所述音频数据是否包括所述音频水印的所述数据包括:接收指示所述音频数据不包括所述音频水印的所述数据,
确定继续或停止对所述音频数据的处理包括:基于接收到指示所述音频数据不包括所述音频水印的所述数据来确定继续对所述音频数据的处理,并且
所述方法进一步包括:基于确定继续对所述音频数据的处理,由所述计算设备继续对所述音频数据的处理。


4.根据任意前述权利要求所述的方法,其中对所述音频数据的处理包括:
通过对所述音频数据执行语音识别来生成所述话语的转录。


5.根据任意前述权利要求所述的方法,其中对所述音频数据的处理包括:
确定所述音频数据是否包括特定的预定义热词的话语。


6.根据任意前述权利要求所述的方法,包括:
在提供所述音频数据作为所述模型的输入之前,由所述计算设备确定所述音频数据包括特定的预定义热词的话语,所述模型(i)被配置成确定给定音频...

【专利技术属性】
技术研发人员:亚历山大·H·格伦斯坦塔拉尔·普拉迪普·约戈莱卡尔维贾亚迪特亚·培丁蒂米希尔·A·U·巴基亚尼
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1