用于识别语音的电子设备制造技术

技术编号:18459726 阅读:60 留言:0更新日期:2018-07-18 13:04
一种电子设备包括:获得音频信号的麦克风;存储讲话者模型的存储器;以及至少一个处理器。所述至少一个处理器被配置为从所述音频信号获得语音信号,将所述语音信号与所述讲话者模型进行比较以验证用户,以及如果验证结果指示所述用户对应于预先登记的讲话者,执行与所获得的语音信号相对应的操作。

An electronic device for speech recognition

An electronic device includes: a microphone for obtaining audio signals; a memory for storing speaker models; and at least one processor. The at least one processor is configured to obtain a voice signal from the audio signal, to compare the voice signal to the speaker model to verify the user, and to perform an operation corresponding to the obtained voice signal if the verification result indicates that the user is corresponding to a pre registered speaker.

【技术实现步骤摘要】
用于识别语音的电子设备相关申请的交叉引用本申请要求2017年1月9日向韩国知识产权局提交的韩国专利申请10-2017-0003085的优先权,该申请的公开通过全文引用合并于此。
本公开总体上涉及识别语音的技术。
技术介绍
随着语音识别技术的发展,配备有麦克风的电子设备(例如,智能手机)已经广泛分布。可以通过语音识别技术识别用户的语音,并且电子设备可以基于识别的语音执行各种操作。例如,电子设备可以基于识别的语音来执行应用或者通过网站搜索信息。电子设备可以仅在应用物理输入时识别语音。例如,电子设备可以仅当用户触摸图标或主(home)按键时识别语音。然而,最近还开发了即使在没有物理输入的情况下仅使用关键字来识别语音的技术。用户需要将预定义关键字存储在电子设备中以仅使用关键字来识别语音。此外,只有当用户说出存储在电子设备中的关键字时,电子设备才执行与关键字相对应的操作。如上所述,由于用户需要直接存储关键字并且说出关键字以便使用仅通过关键字来识别语音的技术,所以用户可能会感到不便。因此,用户可能会避免使用语音识别功能。
技术实现思路
已经做出了本公开以至少解决上述问题和/或缺点,并且至少提供以下描述的优点。因此,本公开的一个方面提供了一种用于解决上述问题的电子设备。根据本公开的另一方面,识别用户的语音信号而无需关键字,由此为用户提供便利。根据本公开的另一方面,低功率处理器识别用户的语音信号,由此降低电子设备的功耗。根据本公开的一个方面,一种电子设备包括获得音频信号的麦克风;存储讲话者模型的存储器;以及至少一个处理器。所述至少一个处理器被配置为从所述音频信号获得语音信号,将所述语音信号与所述讲话者模型进行比较以验证用户,并且如果验证结果指示所述用户对应于预先登记的讲话者,执行与所获得的语音信号相对应的操作。根据本公开的另一方面,一种可穿戴电子设备包括用于感测用户的运动的传感器、用于在感测到运动的情况下获得音频信号的麦克风、存储讲话者模型的存储器以及至少一个处理器。所述至少一个处理器被配置为从所述音频信号获得语音信号,将所述语音信号与所述讲话者模型进行比较以验证用户,并且如果验证结果指示所述用户对应于预先登记的讲话者,执行与所获得的语音信号相对应的操作。附图说明根据以下结合附图给出的详细描述,本公开的以上及其他方面、特征和优点将更加显而易见,在所述附图中:图1示出了根据本公开实施例的网络环境中的电子设备;图2示出了根据本公开实施例的存储在电子设备中的程序模块的框图;图3示出了根据本公开实施例的电子设备的操作的流程图;图4示出了根据本公开的实施例的由至少一个处理器执行的程序模块;图5示出了根据本公开的实施例的通过使用场景分类模块获得语音信号的程序模块;图6示出了根据本公开实施例的登记讲话者模型的程序模块的框图;图7示出了根据本公开实施例的登记讲话者模型并验证用户的程序模块的框图;图8示出了根据本公开的实施例的基于谈话模块和通用背景模块(UBM)来验证用户的用户验证模块;图9示出了根据本公开实施例的存储在可穿戴电子设备中的程序模块的框图;图10示出了根据本公开的实施例的向显示器输出关于是否产生讲话者模型的信息的可穿戴电子设备;图11示出了根据本公开实施例的电子设备的框图;以及图12是根据本公开实施例的程序模块的框图。具体实施方式可以参考附图来描述本公开的实施例。尽管示出在不同的附图中,相同或相似的组件可以用相同或相似的附图标记来表示。可以省略对本领域公知的结构或处理的详细描述,以免混淆本公开的主题。在本公开中,本文中所使用的表述“具有”、“可以具有”、“包含”、“包括”、“可以包含”或“可以包括”指示存在对应的特征(例如,数值、功能、操作或组件),但是不排除一个或多个附加的特征。在本公开中,表述“A或B”、“A和/或B中的至少一个”或“A和/或B中的一个或多个”可以包括列出项中一个或多个的任意和所有组合。例如,表达方式“A或B”、“A和B中至少一项”和“A或B中至少一项”指代的是以下所有情形:(1)包括至少一个A,(2)包括至少一个B,和(3)包括至少一个A和至少一个B二者。这里使用的表述“第一”和“第二”可以表示各种元件,而无论顺序和/或优先级如何,但是并不限制元件。例如,“第一用户设备”和“第二用户设备”指示不同的用户设备,而与顺序或优先级无关。例如,在不脱离本公开的范围的情况下,第一元件可以被称为第二元件,类似地,第二元件可以被称为第一元件。将要理解的是,当一个元件(例如,第一元件)被称为“(操作或通信地)耦接到”或“连接到”另一元件(例如,第二元件)时,所述元件可以直接耦接或直接连接到该另一元件,或者可以存在中间元件(例如,第三元件)。相反,当一元件(例如,第一元件)被称为“直接耦接到”或“直接连接到”另一元件(例如,第二元件)时,应理解,不存在中间元件(例如,第三元件)。本公开中所使用的表述“(被)配置为”可以与表述“适用于”、“具有...的能力”、“(被)设计为”、“适于”、“(被)制造为”和“能够”互换使用。术语“被配置为……”可以不只意味着在硬件方面“被专门设计为……”。相反,表述“(被)配置为...的设备”可以意味着该设备与另一设备或另一组件“能够”一起操作。例如,“被配置为(或被设置为)执行A、B和C的处理器”可以意味着用于执行对应操作的专用处理器(例如,嵌入式处理器)、或通过执行存储设备中所存储的一个或多个软件程序来执行对应操作的通用处理器(例如,中央处理单元(CPU)或应用处理器(AP))。本公开中使用的术语描述具体实施例,而不是为了限制本公开的范围。单数形式的术语可以包括复数形式,除非另有规定。本文使用的所有术语(包括技术或科学术语)可以具有与本领域技术人员通常理解的含义相同的含义。还应该理解,在通用字典中定义并且常用的术语应该按相关技术中的惯例进行解释,而不应该解释为具有理想化或过度刻板的含义,除非在本公开中明确限定。在一些情况下,即使术语是在本公开中定义的术语,也不应将它们理解为排除本公开的实施例。根据本公开的各种实施例的电子设备可以包括以下至少一项:例如智能电话、平板个人计算机(PC)、移动电话、视频电话、电子书阅读器、台式PC、膝上型PC、上网本计算机、工作站、服务器、个人数字助理(PDA)、便携式多媒体播放器(PMP)、移动图像专家组(MPEG-1或MPEG-2)音频层3(MP3)播放器、移动医疗设备、摄像机、或可穿戴设备。可穿戴设备可以包括以下至少一个:饰品型(例如,手表、戒指、手链、脚链、项链、眼镜、隐形眼镜或头戴式设备(HMD))、衣料或服饰集成型(例如,电子服饰)、身体附着型(例如,皮肤贴或纹身)、或生物植入型(例如,可植入电路)。根据本公开的各种实施例,电子设备可以是家用电器。例如,家电可以包括以下至少一项:例如,电视(TV)、数字多功能盘(DVD)播放器、音频播放器、冰箱、空调、吸尘器、烤箱、微波炉、洗衣机、空气净化器、机顶盒、家庭自动控制面板、安保控制面板、TV盒(例如SamsungHomeSyncTM、AppleTVTM或GoogleTVTM)、游戏机(例如XboxTM或PlayStationTM)、电子词典、电子钥匙、摄像机和电子相框。根据本公开实施例,电本文档来自技高网...

【技术保护点】
1.一种电子设备,包括:麦克风,被配置为获得音频信号;存储器,其中存储讲话者模型;以及至少一个处理器,其中所述至少一个处理器被配置为:从所述音频信号中获得语音信号;将所述语音信号与所述讲话者模型进行比较以验证用户;以及如果验证结果指示所述用户对应于预先登记的讲话者,则执行与所获得的语音信号相对应的操作。

【技术特征摘要】
2017.01.09 KR 10-2017-00030851.一种电子设备,包括:麦克风,被配置为获得音频信号;存储器,其中存储讲话者模型;以及至少一个处理器,其中所述至少一个处理器被配置为:从所述音频信号中获得语音信号;将所述语音信号与所述讲话者模型进行比较以验证用户;以及如果验证结果指示所述用户对应于预先登记的讲话者,则执行与所获得的语音信号相对应的操作。2.根据权利要求1所述的电子设备,其中所述至少一个处理器包括电连接到所述麦克风的数字信号处理器DSP和电连接到所述DSP的应用处理器AP,其中所述DSP执行验证所述用户的操作,并且如果所述验证结果指示所述用户是所述预先登记的讲话者,则将所述AP的状态从睡眠状态改变到激活状态,以及其中所述AP从所获得的语音信号中识别命令并且执行与所述命令相关联的操作。3.根据权利要求1所述的电子设备,其中所述至少一个处理器还被配置为:将所述音频信号中具有幅度大于或等于临界值的能量的信号确定为所述语音信号;以及将具有幅度小于所述临界值的能量的信号确定为噪声。4.根据权利要求1所述的电子设备,其中所述至少一个处理器还被配置为:基于所述音频信号的过零率来获得所述语音信号。5.根据权利要求1所述的电子设备,其中所述至少一个处理器还被配置为:基于信噪比SNR来获得所述语音信号。6.根据权利要求1所述的电子设备,其中所述至少一个处理器还被配置为:基于所述音频信号的分布来获得所述语音信号。7.根据权利要求1所述的电子设备,其中所述至...

【专利技术属性】
技术研发人员:李英宇辛晧先李相勋
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1