语音功能的操作方法和支持该方法的电子设备技术

技术编号:16308408 阅读:60 留言:0更新日期:2017-09-27 02:15
提供了一种电子设备。所述电子设备包括:存储器,配置为存储用于语音识别的多条讲话信息的至少一部分;以及处理器,可操作地连接至所述存储器,其中所述处理器基于互相似性从所述多条讲话信息的至少一部分中选择说话者讲话信息,并且基于所述说话者讲话信息来产生要被注册为个人化语音信息的语音识别信息。

Method for operating voice function and electronic device supporting the method

An electronic device is provided. The electronic device includes a memory configured to store at least a portion of a plurality of speech information of speech recognition; and a processor operatively connected to the memory, wherein the processor from the mutual similarity of the plurality of speech information in at least a portion of the speaker selection based on information, and based on the the speaker information generated to be registered as a speech recognition information personalized speech information.

【技术实现步骤摘要】
【国外来华专利技术】语音功能的操作方法和支持该方法的电子设备
本公开涉及一种电子设备中的语音功能的操作。
技术介绍
包括麦克风等的电子设备提供收集和识别用户的语音的功能。例如,近来的电子设备提供识别用户的语音并且输出与所识别的语音相对应的信息的功能。
技术实现思路
技术问题同时,根据典型的语音功能,只识别所收集的语音的内容并且提供与所述内容相对应的服务。因此,典型电子设备的语音功能提供方法可以提供与输入语音的人无关的特定功能。问题的解决方案本专利技术一些实施例的目的在于,至少部分地解决、减轻或消除与现有技术相关联的问题和/或缺点中的至少一个。某些实施例目的在于提供下述优点中的至少一个优点。根据本公开的一个方案,提供了一种电子设备。所述电子设备可以包括:存储器,用于存储用于语音识别的多条讲话信息的至少一部分;以及控制模块(或处理器),配置为基于所述多条讲话信息的至少一部分来产生语音识别信息,其中所述控制模块可以配置为基于互相似性从所述多条讲话信息的至少一部分中选择说话者讲话信息,并且可以配置为基于所述说话者讲话信息来产生要被注册为个人化语音信息的语音识别信息。应该理解的是说话者讲话信息是来自单个具体说话者(即人或用户)或者与其相对应的讲话信息。换句话说,所述控制模块可以配置为基于多条讲话信息之间的相似性,确定所述多条讲话信息来自于同一说话者或者与同一说话者相对应,并且选择所述多条讲话信息作为“说话者讲话信息”。根据本公开的另一方面,提供了一种语音功能操作方法。所述语音功能操作方法可以包括:存储多条讲话信息的至少一部分用于语音识别;基于互相似性从所述多条讲话信息的至少一部分选择说话者讲话信息;以及基于所选择的说话者讲话信息来产生要被注册为个人化语音信息的语音识别信息。所述方法还可以包括:收集与由所述个人化语音信息相对应的特定说话者输入的其他讲话信息;以及使用所述特定说话者的其他讲话信息来修改所述个人化语音信息的模型。在特定实施例中,所述修改包括:从所述特定说话者输入的讲话信息中提取与在所述个人化语音信息中包括的已注册音素模型相对应的音素样本,并且使用所述音素样本来修改所注册的音素模型。在特定实施例中,所述方法还包括:如果请求功能的新讲话信息不是与所述个人化语音信息相对应的特定说话者的讲话,则基于所述新讲话信息输出无法执行所述功能的消息;以及基于由所述新讲话信息请求的功能的类型来选择性地执行所述功能。在特定实施例中,执行所述功能包括:如果所述功能是指定的安全功能,则不进行所述功能的执行;以及如果所述功能是未指定的非安全功能,则进行所述功能的执行。在特定实施例中,所述方法还包括以下中的至少一个:响应于由基于个人化语音信息指定的说话者输入的讲话信息,输出用于设置要基于语音功能执行的至少一个功能项目的设置屏幕;或者输出所产生的语音识别信息。特定实施例的目的在于当执行某个计算机或者设备交互时实现降低用户负担(例如,认知、实施、操作或者操作开销)的技术效果。特定实施例的目的在于实现提供更有效的人机(用户-机器)接口的技术效果。本专利技术的另一方面提供了一种包括指令的计算机程序,所述指令在被执行时被布置为实现根据上述方面中的任何一个方面的方法和/或装置。另一方面提供了存储这种程序的机器可读存储器。有益效果因此,本公开(即本专利技术)的一个方面是为了提供一种支持电子设备的语音功能的语音功能操作方法和支持该方法的电子设备,使得以取决于用户(即说话者)的方式操作语音功能。本公开的另一个方面是为了提供一种基于输入的音频信号的类型来选择性地提供语音功能的语音功能操作方法和支持该方法的电子设备。附图说明根据以下结合附图的详细描述,本公开的这些和/或其他方面和优点将更加清楚并易于理解,在附图中相同的附图标记指示相同的元素,并且其中:图1是示出了根据本公开各种示例实施例的示例个人化语音功能提供环境的图;图2是示出了根据本公开各种示例实施例的支持语音功能的电子设备的示例的框图;图3是示出了根据本公开各种示例实施例的控制模块的示例的框图;图4是示出了根据本公开各种示例实施例的与取决于说话者的设置相关的示例候选组处理方法的图;图5是示出了根据本公开各种示例实施例的示例个人化语音信息更新的图;图6是示出了根据本公开各种示例实施例的在语音功能的操作期间的个人化语音的示例方法的流程图;图7是示出了根据本公开各种示例实施例的示例个人化语音信息更新方法的流程图;图8是示出了根据本公开各种示例实施例的与个人化语音功能的执行相关的屏幕界面的示例的图;图9是示出了根据本公开各种示例实施例的与个人化语音信息的设置相关的屏幕界面的示例的图;图10是示出了根据本公开各种示例实施例的电子设备的示例的框图;以及图11是示出了根据本公开各种示例实施例的电子设备的另一个示例的框图。具体实施方式在下文中,将参照附图详细地描述本公开的各种示例实施例。然而,应当理解的是,本公开并不限于具体示例实施例,而是包括本公开各种示例实施例的各种修改、等同和/或替代。至于附图的描述,类似的附图标记可以表示类似的元件。本文使用的术语“具有”、“可以具有”、“包括”、“可以包括”、“包含”等表示存在相应的特征(例如,数值、功能、操作或元件),但是不排除其他特征的存在。术语“A或B”、“A或/和B中的至少一项”或“A或/和B中的一个或多个”可以包括所列出项目的所有可能组合。例如,术语“A或B”、“A和B中至少一项”或“A或B中至少一项”可以表示以下所有情形:(1)包括至少一个A,(2)包括至少一个B,以及(3)包括至少一个A和至少一个B。本文中使用的诸如“第一”、“第二”等的术语可以修饰各种元件,而与顺序和/或重要性无关,并且不意图限制这些元件。例如,“第一用户设备”和“第二用户设备”可以表示不同的用户设备,而与顺序或优先级无关。例如,在不脱离本公开的范围的情况下,第一元件可以被称为第二元件,反之亦然。应理解,当特定元件(例如,第一元件)被称为“操作地或者通信地耦接至”或者“连接至”另一元件(例如,第二元件)时,该特定元件可以直接耦接或连接至该另一元件,或者可以经由其它元件(例如第三元件)耦接或连接至该另一元件。然而,当特定元件(例如,第一元件)被称为“直接耦接至”或者“直接连接至”另一元件(例如,第二元件)时,在该元件和该另一元件之间不存在中间元件(例如,第三元件)。术语“被配置(或设置)为”可以与术语例如“适合于”、“具有……的能力”、“被设计为”、“适于”、“使……”或者“能够……”互换使用。术语“被配置(或设置)为”可以不必须具有“被专门设计为”的意义。在一些示例中,术语“设备被配置为”可以表示该设备“可以”与其他设备或组件一起“执行”某些操作。例如,术语“处理器被配置(或设置)为执行A、B和C”可以表示用于执行相应操作的专用处理器(例如,嵌入式处理器)、处理电路,或者用于执行存储在存储器中的至少一个软件程序以执行相应操作的通用处理器(例如,CPU或应用处理器)。本文使用的术语仅用于描述示例实施例,并且不意图限制其他实施例的范围。除非另有规定,否则单数形式的术语可以包括复数形式。本文使用的术语(包括技术或科学术语)具有与本领域技术人员所理解的意义相同的意义。在字典中定义的常用术语可以被解释为具有与在相关技术本文档来自技高网...
语音功能的操作方法和支持该方法的电子设备

【技术保护点】
一种电子设备,包括:存储器,配置为存储用于语音识别的多条讲话信息;以及包括处理电路在内的处理器,所述处理器与所述存储器功能性地连接,其中所述处理器配置为基于互相似性从所述多条讲话信息的至少一部分中选择说话者讲话信息,并且基于所述说话者讲话信息来产生要被注册为个人化语音信息的语音识别信息。

【技术特征摘要】
【国外来华专利技术】2015.02.11 KR 10-2015-00207861.一种电子设备,包括:存储器,配置为存储用于语音识别的多条讲话信息;以及包括处理电路在内的处理器,所述处理器与所述存储器功能性地连接,其中所述处理器配置为基于互相似性从所述多条讲话信息的至少一部分中选择说话者讲话信息,并且基于所述说话者讲话信息来产生要被注册为个人化语音信息的语音识别信息。2.根据权利要求1所述的电子设备,其中所述处理器配置为输出提供通知的消息,所述通知表明正在执行将所述语音识别信息应用于语音识别的操作。3.根据权利要求1或2所述的电子设备,其中所述处理器配置为执行以下操作中的至少一个:在指定时间内收集所述多条讲话信息、或者收集所述多条讲话信息直到收集到指定数目的所述多条讲话信息。4.根据前述权利要求中任一项所述的电子设备,其中所述处理器配置为产生至少一部分噪声或指定声音效果中的至少一个被应用于所述多条讲话信息的多条件训练模型,并且使用所述多条件训练模型来确定要被注册为个人化语音信息的语音识别信息。5.根据前述权利要求中任一项所述的电子设备,其中所述处理器配置为产生噪声或指定声音效果中的至少一个被应用于所述说话者讲话信息的多条件训练模型,并且基于所述多条件训练模型来确定要被注册为个人化语音信息的语音识别信息。6.根据前述权利要求中任一项所述的电子设备,其中所述处理器配置为收集由与所述个人化语音信息相对应的特定说话者输入的其他讲话信息,并且修改所述个人化语音信息的模型。7.根据权利要求6所述的电子设备,其中所述处理器配置为从所述特定说话者输入的讲话信息中提取与所述个人化语音信息中包括的已注册音素模型相对应的音素样本,并且使用所述音素样本修...

【专利技术属性】
技术研发人员:查卡拉达·苏波吉
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1