噪音过滤方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:32912328 阅读:17 留言:0更新日期:2022-04-07 12:03
本申请实施例涉及自然语言处理技术领域,公开了一种噪音过滤方法、装置、电子设备和计算机可读存储介质,该方法包括:将获取到的语音信息转换成文本信息;将语音信息和文本信息输入至预训练的识别模型中,得到对语音信息的识别结果;其中,识别结果为噪音或正常语音,识别模型包括用于提取语音信息的第一特征的第一提取网络、用于提取文本信息的第二特征的第二提取网络、用于根据第一特征和第二特征判断语音信息为噪音或正常语音的判别网络;若识别结果为噪音,则不响应语音信息;若识别结果为正常语音,则响应语音信息,可以融合语音信息和文本信息这两种模态的信息来综合判别收到的语音是否为噪音,大幅提升了噪音过滤的效果和强度。和强度。和强度。

【技术实现步骤摘要】
噪音过滤方法、装置、电子设备和计算机可读存储介质


[0001]本申请实施例涉及自然语言处理
,特别涉及一种噪音过滤方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0002]随着人工智能技术的不断发展,智能服务机器人、智能设备等产品大量涌现,用户对于智能服务机器人、智能设备的人机交互的要求也随之提高,用户希望智能服务机器人、智能设备能够正确理解用户的意图并做出正确的响应,因此智能服务机器人、智能设备需要判别用户在说什么,用户的哪句话是对自身说的,这需要由语音识别(Automatic Speech Recognition,简称:ASR)模块和自然语言理解(Natural Language Understanding,简称:NLU)模块来实现,ASR模块对所有的人声进行识别,NLU模块则需要判断当前这句话是否是对智能服务机器人、智能设备说的,如果不是,那么NLU模块认为当前这句话是噪音,不进行响应。
[0003]然而,在实际应用场景中,智能服务机器人、智能设备可能会工作在嘈杂的环境中,如电影院、医院等,这些场景下的噪音比例很高,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种噪音过滤方法,其特征在于,包括:将获取到的语音信息转换成文本信息;将所述语音信息和所述文本信息输入至预训练的识别模型中,得到对所述语音信息的识别结果;其中,所述识别结果为噪音或正常语音,所述识别模型包括用于提取所述语音信息的第一特征的第一提取网络、用于提取所述文本信息的第二特征的第二提取网络、以及用于根据所述第一特征和所述第二特征判断所述语音信息为噪音或正常语音的判别网络;若所述识别结果为噪音,则不响应所述语音信息,若所述识别结果为正常语音,则响应所述语音信息。2.根据权利要求1所述的噪音过滤方法,其特征在于,所述第一提取网络包括第一编码网络、卷积神经网络和全连接层,所述第一编码网络与所述卷积神经网络连接,所述卷积神经网络与所述全连接层连接;所述第一编码网络用于对所述语音信息的物理信息进行编码,得到所述语音信息的低阶编码信息,并将所述低阶编码信息输入至所述卷积神经网络;所述卷积神经网络用于对所述低阶编码信息进行特征提取,得到所述语音信息的高阶编码信息,并将所述高阶编码信息输入至所述全连接层;所述全连接层用于根据所述高阶编码信息获得所述语音信息的第一特征。3.根据权利要求2所述的噪音过滤方法,其特征在于,所述语音信息的物理信息包括以下任意一个或任意组合:所述语音信息的音量,所述语音信息的音调,所述语音信息的音色和所述语音信息的语速。4.根据权利要求1所述的噪音过滤方法,其特征在于,所述第二提取网络包括第二编码网络和全连接层,所述第二编码网络与所述全连接层连接;所述第二提取网络用于对所述文本信息进行编码,得到所述文本信息的语义编码信息,并将所述语义编码信息输入至所述全连接层;所述全连接层用于根据所述语义编码信息获得所述语音信息的第二特征。5.根据权利要求1至4中任一项所述的噪音过滤方法,其特征在于,所述判别网路包括合并层、全连接层、softmax函数层和输出层,所述合并层与所述全连接层连接,所述全连接层与所述softmax函数层连接,所述softmax函数层与所述输出层连接;所述合并层用于将所述第一特征和所述第二特征拼接成第三特征;所述输出层用于输出所述语音信息对应的输出向量;其中,所述输出向量用于表征所述语音信息为噪音的概率和所述语音信息为正常语音的概率。6.根据权利要求1至4中任一项所述的噪音过滤方法,其特征在于,所述预训练的识别模型通过以下步骤进行训练:根据所述第一提取网络、所述第二提取网络和所...

【专利技术属性】
技术研发人员:李翠姣
申请(专利权)人:达闼科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1