生成自动语音辨识模型的无意记忆度量制造技术

技术编号:43584603 阅读:27 留言:0更新日期:2024-12-06 17:48
可使用无意记忆度量来确定自动语音辨识(ASR)模型在ASR模型的训练期间是否无意地记忆了一个或多个短语。各种实现方式包括基于ASR模型的词表生成一个或多个候选转录。例如,系统可以通过将词表的词元添附到先前候选转录来生成候选转录。各种实现方式包括使用语音合成模型来处理候选转录以生成包括候选转录的合成语音的合成语音音频数据。另外或替代地,可以使用ASR模型来处理合成语音音频数据以生成ASR输出。各种实现方式可以包括基于将ASR输出与候选转录进行比较来生成损失。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、基于话音的用户接口越来越多地用于控制计算机和其他电子装置。基于话音的用户接口已从只能理解简单且直接的命令的早期基本接口不断发展到对自然语言请求作出响应并且可以理解场境并管理与用户的往来对话或交谈的更复杂的接口。许多基于话音的用户接口对口头话语执行语音辨识(例如,使用自动语音辨识模型)以生成对应的文本,对文本执行语义分析以试图确定口头话语的含义并且/或者基于所确定的含义采取一个或多个动作。然而,自动语音辨识模型可能无意地记忆在训练模型时使用的基础数据。


技术实现思路

1、本文描述的实现方式旨在生成自动语音辨识(“asr”)模型的无意记忆度量,该无意记忆度量指示在训练期间asr模型无意地记忆一个或多个短语的程度。在训练时,asr模型可能无意地记忆训练数据中罕见或独特的序列。在一些实现方式中,无意地记忆的序列可以包括有关用户的敏感信息。例如,asr模型可以无意地记忆基于用户说出话语“myusername is patentsforlife and my password is i love pate本文档来自技高网...

【技术保护点】

1.一种由一个或多个处理器实现的方法,所述方法包括:

2.如权利要求1所述的方法,其中,使用与所述ASR模型相对应的所述词表生成所述候选转录包括:

3.如权利要求2所述的方法,还包括:

4.如权利要求1所述的方法,其中,基于所述ASR输出与所述候选转录的比较生成所述损失包括:

5.如权利要求1所述的方法,其中,基于所述ASR输出与所述候选转录的比较生成所述损失包括:

6.如权利要求1所述的方法,还包括:

7.如权利要求1所述的方法,还包括:

8.如权利要求1所述的方法,还包括:

9.如权利要求...

【技术特征摘要】
【国外来华专利技术】

1.一种由一个或多个处理器实现的方法,所述方法包括:

2.如权利要求1所述的方法,其中,使用与所述asr模型相对应的所述词表生成所述候选转录包括:

3.如权利要求2所述的方法,还包括:

4.如权利要求1所述的方法,其中,基于所述asr输出与所述候选转录的比较生成所述损失包括:

5.如权利要求1所述的方法,其中,基于所述asr输出与所述候选转录的比较生成所述损失包括:

6.如权利要求1所述的方法,还包括:

7.如权利要求1所述的方法,还包括:

8.如权利要求1所述的方法,还包括:

9.如权利要求1所述的方法,其中,与所述asr模型相对应的所述词表包括词元集合、字符集合、字母集合、词集合、词片段集合和/或音素集合。

10.一种由一个或多个处理器实现的方法,所述方法包括:

11.如权利要求10所述的方法,还包括:

12.如权利要...

【专利技术属性】
技术研发人员:奥姆·迪帕克巴伊·塔卡尔哈基姆·希达哈梅德W·罗尼·黄拉吉夫·马修斯弗朗索瓦丝·博费斯弗洛里恩·特雷梅尔
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1