电子设备及其控制方法技术

技术编号:31373483 阅读:22 留言:0更新日期:2021-12-15 11:03
公开了一种电子设备和用于控制电子设备的方法。本公开的电子设备包括麦克风、存储至少一个指令的存储器和被配置为执行至少一个指令的处理器。处理器通过执行至少一个指令被配置为:通过将经由麦克风输入的第一语音数据输入到被训练为增强声音质量的第一模型来获得第二语音数据,通过将第一语音数据和第二语音数据输入到第二模型来获得权重,以及使用权重识别要输入到第三模型的输入数据。重识别要输入到第三模型的输入数据。重识别要输入到第三模型的输入数据。

【技术实现步骤摘要】
【国外来华专利技术】电子设备及其控制方法


[0001]本公开涉及一种电子设备和用于控制电子设备的方法,并且例如涉及一种基于语音数据和通过对语音数据应用用于增强声音质量的算法而获得的数据来确定要输入到特定模型的数据的电子设备以及用于控制电子设备的方法。

技术介绍

[0002]传统上已开发和使用了各种算法(例如,用于滤除语音信号中包含的噪声的算法、基于波束成形的算法、基于神经网络的映射特征的算法等),以增强语音的声音质量。
[0003]当将用于增强声音质量的算法应用于正常嘈杂环境中输入的用户语音时,可以增强语音的声音质量。然而,如果将用于增强声音质量的算法应用于在噪声相对较小或基本没有噪声的干净环境中输入的用户语音,则语音的声音质量可能会劣化。
[0004]换句话说,传统的增强算法将输入数据映射到目标数据以最小化或最大化确定的目标函数,但是不测量映射的输出数据的可靠性程度。因此,增强算法在特定情况下可能会劣化而不是增强语音的声音质量。

技术实现思路

[0005]技术问题
[0006]鉴于上述需要做出本公开,并且本公开提供了一种基于语音数据和通过将语音数据输入到用于增强声音质量的模型而获得的输出数据来确定要输入到特定模型的输入数据的电子设备以及用于控制电子设备的方法。
[0007]问题的解决方案
[0008]本公开的实施例提供了一种基于语音数据和通过将语音数据输入到用于增强声音质量的模型而获得的输出数据来确定要输入到特定模型的输入数据的电子设备以及用于控制电子设备的方法。
[0009]根据本公开的示例实施例,提供了一种电子设备,该电子设备包括:麦克风、存储至少一个指令的存储器、以及处理器,被配置为执行所述至少一个指令,其中,处理器通过执行所述至少一个指令被配置为:通过将经由麦克风输入的第一语音数据输入到被训练为增强声音质量的第一模型来获得第二语音数据,通过将第一语音数据和第二语音数据输入到第二模型来获得权重,以及使用权重识别要输入到第三模型的输入数据。
[0010]处理器可以使用第一语音数据、第二语音数据、以及第二语音数据与对应于第一语音数据的干净语音数据之间的误差的估计值来获得权重。
[0011]处理器可以基于权重将第一语音数据和第二语音数据线性组合;以及识别线性组合的值作为输入数据。
[0012]处理器可以基于权重识别第一语音数据和第二语音数据中的一个作为输入数据。
[0013]处理器可以基于权重大于阈值,识别第二语音数据作为输入数据,以及基于权重小于阈值,识别第一语音数据作为输入数据。
[0014]处理器可以基于权重大于第一阈值,识别第二语音数据作为输入数据,基于权重大于第二阈值且小于第一阈值,基于权重将第一语音数据和第二语音数据线性组合并识别线性组合的值作为输入数据,以及基于权重小于第二阈值,识别第一语音数据作为输入数据,其中,第一阈值可以是大于第二阈值的值。
[0015]第三模型可以是唤醒模型或自动语音识别模型中的至少一个。
[0016]处理器可以基于第一语音数据、对应于第一语音数据的干净语音数据和第二语音数据来训练第一模型和第二模型。
[0017]处理器可以通过向第三模型输入第一语音数据和第二语音数据中的每一个,获得与第一语音数据对应的第一得分并获得与第二语音数据对应的第二得分,以及基于第一语音数据、第二语音数据、第一得分和第二得分来训练第二模型。
[0018]处理器可以通过将第一语音数据和第二语音数据输入到第二模型,获得第一得分与第二得分之间的差的估计值,以及基于第一得分与第二得分之间的差的估计值获得权重。
[0019]根据本公开的另一示例实施例,一种用于控制包括麦克风的电子设备的方法,该方法包括:通过将经由麦克风输入的第一语音数据输入到被训练为增强声音质量的第一模型来获得第二语音数据;通过将第一语音数据和第二语音数据输入到第二模型来获得权重;以及使用权重识别要输入到第三模型的输入数据。
[0020]获得可以包括基于第一语音数据、第二语音数据、以及第二语音数据与对应于第一语音数据的干净语音数据之间的误差的估计值来获得权重。
[0021]识别可以包括基于权重将第一语音数据和第二语音数据线性组合,以及识别线性组合的值作为输入数据。
[0022]识别可以包括基于权重识别第一语音数据和第二语音数据中的一个作为输入数据。
[0023]识别可以包括基于权重大于阈值,识别第二语音数据作为输入数据,以及基于权重小于阈值,识别第一语音数据作为输入数据。
[0024]确定可以包括基于权重大于第一阈值,识别第二语音数据作为输入数据,基于权重大于第二阈值且小于第一阈值,基于权重将第一语音数据和第二语音数据线性组合,并识别线性组合的值作为输入数据,以及基于权重小于第二阈值,识别第一语音数据作为输入数据,其中,第一阈值是大于第二阈值的值。
[0025]第三模型可以是唤醒模型或自动语音识别模型中的至少一个。
[0026]该方法还可以包括基于第一语音数据、对应于第一语音数据的干净语音数据和第二语音数据来训练第一模型和第二模型。
[0027]该方法还可以包括通过向第三模型输入第一语音数据和第二语音数据中的每一个,获得与第一语音数据对应的第一得分并获得与第二语音数据对应的第二得分,以及基于第一语音数据、第二语音数据、第一得分和第二得分来训练第二模型。
[0028]获得权重可以包括通过将第一语音数据和第二语音数据输入到第二模型,获得第一得分与第二得分之间的差的估计值,以及基于第一得分与第二得分之间的差的估计值获得权重。
[0029]专利技术的有利效果
[0030]如上所述,根据本公开的实施例,用户可以更有效地使用语音识别系统,因为电子设备基于语音数据和通过对语音数据应用用于增强声音质量的算法而获得的数据来确定(例如,识别)要输入到特定模型的数据。
附图说明
[0031]从以下结合附图的详细描述中,本公开的某些实施例的上述和其他方面、特征和优点将更加清晰,在附图中:
[0032]图1是示出根据实施例的电子设备的示例配置和操作的框图;
[0033]图2A和图2B是示出根据实施例的电子设备训练第二模型的示例过程的框图;
[0034]图3和图4是示出根据实施例的电子设备使用获得的权重确定输入数据的示例过程的流程图;
[0035]图5是示出根据实施例的电子设备的示例配置的框图;以及
[0036]图6是示出根据实施例的用于控制电子设备的示例方法的流程图。
具体实施方式
[0037]鉴于上述需要做出本公开,并且本公开提供了一种基于语音数据和通过将语音数据输入到用于增强声音质量的模型而获得的输出数据来确定要输入到特定模型的输入数据的电子设备以及用于控制电子设备的方法。
[0038]图1所示的电子设备100可以基于经由麦克风110输入的第一语音数据和通过将用于增强声音质量的算法应用于第一语音数据而获得的第二语音数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种电子设备,包括:麦克风;存储至少一个指令的存储器;以及处理器,被配置为执行所述至少一个指令,其中,处理器通过执行所述至少一个指令被配置为:通过将经由麦克风输入的第一语音数据输入到被训练为增强声音质量的第一模型来获得第二语音数据,通过将第一语音数据和第二语音数据输入到第二模型来获得权重,以及使用权重识别要输入到第三模型的输入数据。2.根据权利要求1所述的设备,其中,所述处理器还被配置为使用第一语音数据、第二语音数据、以及第二语音数据与对应于第一语音数据的干净语音数据之间的误差的估计值来获得权重。3.根据权利要求1所述的设备,其中,所述处理器还被配置为:基于权重将第一语音数据和第二语音数据线性组合;以及识别线性组合的值作为输入数据。4.根据权利要求1所述的设备,其中,所述处理器还被配置为基于权重识别第一语音数据和第二语音数据中的一个作为输入数据。5.根据权利要求4所述的设备,其中,所述处理器还被配置为:基于权重大于阈值,识别第二语音数据作为输入数据,以及基于权重小于阈值,识别第一语音数据作为输入数据。6.根据权利要求1所述的设备,其中,所述处理器还被配置为:基于权重大于第一阈值,识别第二语音数据作为输入数据,基于权重大于第二阈值且小于第一阈值,基于权重将第一语音数据和第二语音数据线性组合,并识别线性组合的值作为输入数据,以及基于权重小于第二阈值,识别第一语音数据作为输入数据,其中,第一阈值是大于第二阈值的值。7.根据权利要求1所述的设备,其中,第三模型是唤醒模型或自动语音识别模型中的至少一个。8.根据权利要求1所述的设备,其中,所述处理器还被配置为:基...

【专利技术属性】
技术研发人员:金灿佑金志研李暻慜韩昌玗
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1