当前位置: 首页 > 专利查询>英特尔公司专利>正文

自动语境绑定领域特定话音识别的方法和系统技术方案

技术编号:37960130 阅读:28 留言:0更新日期:2023-06-30 09:35
本公开涉及自动语境绑定领域特定话音识别的方法和系统。一种自动语境绑定领域特定话音识别的系统、物品和方法使用一般语言模型。物品和方法使用一般语言模型。物品和方法使用一般语言模型。

【技术实现步骤摘要】
自动语境绑定领域特定话音识别的方法和系统


[0001]本公开涉及自动语境绑定领域特定话音识别的方法和系统。

技术介绍

[0002]自动话音识别(automatic speech recognition,ASR)系统已变得越来越重要,因为越来越多的基于计算机的设备使用话音识别来从用户接收命令以便执行一些动作,以及将话音转换为文本,用于听写应用或者举行视频会议,其中在一个或两个方向上交换信息。ASR还可用于自动有害话音检测,其中统计语言模型可以检测出攻击性、不适当、粗俗、侮辱性或者伤害性的话音。这可能是在线游戏环境所需要的,以避免儿童听到这种有害话音。有害话音检测可用于随后对违规话音进行清空或用哔声盖过,以便听众无法听到有害的词语。否则,例如系统可以警告游戏平台上的违规用户改变其行为,或者终止违规用户对平台的访问。有害话音检测也可以被社交视频或音频网站用来监视上传到其平台的视频或音频。然而,执行这些任务的常规领域特定ASR语言模型往往是非常不准确的。

技术实现思路

[0003]根据本公开的一方面,提供了一种由计算机实现的音频处理的方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种由计算机实现的音频处理的方法,包括:获得一般句子或一般短语或者两者的自动话音识别一般数据集;生成领域数据集,包括选择带有来自领域列表的一个或多个领域单词或领域短语的一般句子或一般短语或者两者的至少一些部分,并且将所选择的一般句子或一般短语或者两者的至少一些部分添加到所述领域数据集;并且训练领域语言模型,该领域语言模型被布置为识别领域单词、领域短语以及领域句子的至少一些部分,其中包括使用所述领域数据集。2.如权利要求1所述的方法,其中,所述领域是有害语言,所述有害语言在当音频被捕捉来由所训练的领域语言模型分析时存在的环境中被认为是不合需要或者不适当的语言。3.如权利要求1所述的方法,其中,要被添加到所述领域数据集的一般句子或一般短语的至少一些部分是来自所述一般数据集的整个句子或整个短语。4.如权利要求1

3中任一项所述的方法,包括生成语境n元语法以添加到所述领域数据集,包括选择带有所述领域单词或领域短语的所选择的一般句子或一般短语中的n元语法。5.如权利要求4所述的方法,包括生成多个语境n元语法,其中每一者在所述一般句子或一般短语中具有至少一个领域单词,其中,生成多个语境n元语法包括在带有所述领域单词的一般句子或一般短语上使用滑动窗口。6.如权利要求4所述的方法,其中,生成语境n元语法包括选择多个语境n元语法,所述多个语境n元语法的每一者包括来自单个一般句子或单个一般短语的相同领域单词,其中,在相同一般句子或一般短语中的相同领域单词的每个语境n元语法内,相同领域单词的位置是不同的。7.如权利要求6所述的方法,其中,单词总数中的语境n元语法大小保持固定。8.如权利要求4所述的方法,其中,所述语境n元语法的每一者是三个或五个单词。9.如权利要求4所述的方法,其中,生成语境n元语法包括选择多个语境n元语法,所述多个语境n元语法的每一者包括来自一般句子或一般短语之一中的相同位置的相同领域单词,其中,每个语境n元语法中的来自所述一般句子或一般短语的单词的数目在所述多个语境n元语法中是不同的。10.如权利要求4所述的方法,包括将所述一般句子或一般短语的语境n元语法添加到所述领域数据集,而不是将所选择的一般句子和一般短语添加到与所述语境n元语法相关联的领域数据集。11.如权利要求1

10中任一项所述的方法,包括训练一般语言模型;并且形成经训练的一般和领域特定语言模型,包括组合所述一般语言模型和所述领域语言模型。12.一种由计算机实现的自动领域话音识别的系统,包括:存储器,其存储人类话音的音频信号;以及处理器电路,其形成与所述存储器通信地连接的至少一个处理器,所述至少一个处理器被布置为通过以下步骤来进行操作:获得一般句子或一般短语或者两者的自动话音识别一般数据集;生成领域数据集,包括选择带有来自领域列表的一个或多个领域单词或领域短语的一般句子或一般短语或者两者的至少一些部分,并且将所选择的一般句子或一般短语或者两者的至少一些部分添加到所述领域数据集;并且
训练领域语言模型,该领域语言模型被布置为识别领域单词、领域短语以及领域句子的至少一些部分,其中包括使用所述领域数据集。13.如权利要求12所述的系...

【专利技术属性】
技术研发人员:西蒙
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1