混合性能缩放或语音识别制造技术

技术编号:28627752 阅读:60 留言:0更新日期:2021-05-28 16:24
本申请涉及混合性能缩放或语音识别。本公开的各方面描述用于在低功率状态下运行的客户端装置平台上执行操作的方法和设备。第一分析可以用于向所记录的非触觉输入分配第一置信度得分。当所述第一置信度得分高于第一阈值时,可以激活中间功率状态。第二更详细的分析可以随后向所述非触觉输入分配第二置信度得分。当所述第二置信度得分高于第二阈值时,则启动操作。需要强调的是提供本摘要是为了符合要求允许搜索者或其他读者快速确定本技术公开的主题的摘要的规则。对摘要的提交应具有以下理解:所述摘要将不会用以解释或限制权利要求的范围或含义。

【技术实现步骤摘要】
混合性能缩放或语音识别本申请是申请号为201480007443.1、申请日为2014年02月18日、专利技术名称为“混合性能缩放或语音识别”的专利技术专利申请的分案申请。优先权要求本申请要求2013年2月20日提交的美国临时专利申请号61/767,065的优先权权益,所述临时专利申请的全部内容以引用的方式并入本文。本申请要求2013年3月8日提交的美国临时专利申请号13/791,716的优先权权益,所述临时专利申请的全部内容以引用的方式并入本文。
本公开的各方面涉及在低功率环境下的语音使用和手势识别。
技术介绍
许多电子装置诸如但不限于计算机、电视机、游戏机以及立体声系统在不使用时采用低功率状态以减少能耗。通过切断非必要子系统的电源和将随机存取存储器(RAM)置于刚好足以保留其数据的最小功率状态,低功率状态能够降低电子装置的功耗。每一个子系统的状态存储在RAM中。因此,一旦电子装置脱离低功率状态,该装置可以立即准备再次使用,而不必重新启动或加载在低功率模式启动之前在运行的应用程序。低功率状态,诸如S3睡眠状态,在惠普公司等在2005年4月发表的“AdvancedConfigurationandPowerInterfaceSpecification”版本4.0a中详细描述,该规范通过引用并入本文。然而,一旦处于低功率状态,装置通常需要一种肯定的触觉输入以“唤醒”电子装置并返回到正常全功率状态。借助示例,肯定的触觉输入可以包括按下电源按钮或敲击键盘上的键或遥控器上的按钮。电子装置恢复到它们的正常运行状态需要肯定的触觉输入,因为在低功率状态的处理功率大大降低。可替代输入诸如音频或视频提示还没有选择,因为复杂的语音和手势识别需要太多的CPU周期充当唤醒电子装置的肯定期望的可靠指示。因此,如果用户想把电子装置从低功率状态唤醒,那么用户必须物理接触电子装置或该电子装置的遥控器。如果电子装置在房间的另一边而遥控器丢失,那么用户必须物理移动到房间的另一边以激活该电子装置。因此,本领域中存在为减少用户的负担,通过不需要物理接触电子装置或遥控器的输入允许把电子装置从低功率状态唤醒的系统和方法的必要。正是在这样的背景下,产生了本公开的各个方面。附图说明通过下列具体实施方式连同附图,本专利技术的教义可以很容易理解,其中:图1是根据本公开的一个方面,在网络上通信的客户端装置平台和基于云的服务器的示意图。图2是根据本公开的一个方面,描绘执行操作的方法的流程图,同时客户端装置平台处于低功率状态。图3是根据本公开的另外方面,描绘执行操作的方法的流程图,同时客户端装置平台处于低功率状态。图4是根据本公开的一个方面,描述用于执行操作的指令的图,同时客户端装置平台处于低功率状态。图5是根据本公开的另外方面,描述用于执行操作的指令的图,同时客户端装置平台处于低功率状态。具体实施方式虽然下面的具体实施方式包含用于说明用途的详细细节,但是本领域的任何普通技术人员应当理解,对下列具体实施方式所做的许多变动在本专利技术的范围内。因此,下面描述的本专利技术的示例性实施例在不失一般性并且未暗示要求保护的本专利技术的限制的情况下进行阐述。本公开的各方面描述通过使用非触觉输入对处于低功率状态的客户端装置平台执行操作的系统和方法。如本文所使用的,术语“非触觉输入”一般是指不需要用户物理接触输入装置的输入。此类非触觉输入的示例包括但不限于音频输入和光输入,音频输入可例如经由麦克风来接收,光输入可以例如通过光传感器或图像捕捉装置来接收。其他类型的“非触觉”输入包括但不限于气味传感器、红外传感器、超声波传感器、电容式感应、运动传感器和雷达传感器。在客户端装置平台中,低功率状态可以包括向至少低功率处理器、一个或多个传感器和低功率存储器供电。一个或多个传感器可以记录非触觉输入并将它们存储在低功率存储器上。低功率处理器经配置对所记录的非触觉输入运行第一分析。第一分析可以提供第一置信度得分,第一置信度得分指示所记录的非触觉输入是匹配于第一基准输入的输入的可能性。如果置信度得分高于第一阈值,则低功率处理器可指示客户端装置平台启动中间功率状态。中间功率状态可以包括向第二处理器提供电源。第二处理器可以具有比低功率处理器更多的CPU周期,但是比客户端装置平台在全功率状态运行时具有更少的CPU周期。一旦第二处理器被激活,它可以执行将非触觉输入与第一基准刺激进行比较的第二分析。因为第二分析以另外的CPU周期来执行,所以能够提供非触觉输入是否匹配第一基准信号的更准确预测。第二置信度值通过第二分析确定。如果第二置信度得分高于第二阈值,则第二处理器可以生成指示客户端装置平台执行一个或多个操作的命令信号。一个或多个操作中的每一个可以与指定的第一基准信号相关联。借助示例而不是为了限制,如果第一基准信号是短语“装置接通”,那么与第一基准信号相关联的操作可以促使客户端装置平台启动全功率状态。因此,如果在与基准输入“装置接通”相比时非触觉输入具有高于第二阈值水平的第二置信度得分,那么可以生成指示客户端装置平台执行促使客户端装置平台启动全功率状态的操作的命令信号。根据本公开的另外方面,第一分析可以根据第一基准信号来进行,以及第二分析可以根据第二基准信号来进行。第一基准信号可以比第二基准信号更短。因此,存储在低功率存储器上以分析信号所需的数据更少。借助示例而不是为了限制,第一基准信号可以用于确定人的声音是否被检出,或如果是短语诸如“装置接通”,是否已由用户说出。第二基准信号可以更长,并且可以与更复杂的操作相关联。借助示例,第二基准信号可以用于确定人的声音是否已说出短语“装置接通-玩视频游戏一”。如果该短语与足够高的第二置信度值匹配,则可以生成指示客户端装置平台执行更复杂操作诸如启动客户端装置平台上的全功率状态并加载视频游戏一使得其准备好供用户玩的命令信号。根据本公开的另外方面,第二分析可以在基于云的服务器上实施。当第一分析产生高于第一阈值的第一置信度得分时,客户端装置平台可以通过网络向基于云的服务器传送非触觉输入。第二分析随后在基于云的服务器上执行。如果第二分析产生高于第二阈值的第二置信度得分,则基于云的服务器可以通过网络向客户端装置平台回传命令该客户端装置平台执行与该基准信号相关联的一个或多个操作的命令。图1是根据本公开的各方面,说明客户端装置平台105与基于云的服务器106之间交互的示意图。基于云的服务器106可以由客户端装置平台105通过网络160来访问。客户端装置平台105可以包括中央处理器单元(CPU)131。借助示例,CPU131可以包括一个或多个处理器,其可以被配置为例如双核、四核、多核或单元处理器结构。客户端装置平台105还可以包括存储器132(例如,RAM、DRAM、ROM等)。CPU131可以执行处理-控制程序133,该程序的部分可以存储在存储器132中。客户端装置平台105还可以包括公知的支持电路140,诸如输入/输出(I/O)电路141、电源(P/S本文档来自技高网...

【技术保护点】
1.一种方法,其包括:/n用一个或多个传感器将一个或多个非触觉输入记录到装置,其中所述一个或多个输入被记录到第一存储器,其中所述装置在低功率状态下运行,在所述低功率状态下,电源提供给第一处理器和所述第一存储器;/n生成一个或多个第一置信度得分,其中所述一个或多个第一置信度得分中的每一个是对应记录的非触觉输入与存储在所述第一存储器中的基准输入之间相似度的量度;/n当所述第一置信度得分高于第一阈值水平时,启动所述装置的中间功率状态,其中所述中间功率状态包括向至少第二处理器提供电源,其中所述第二处理器具有比所述第一处理器更大量的可用处理能力;/n当所述第一置信度得分在质询范围内时,输出质询信号,并且当所述质询信号的响应被所述一个或多个传感器检测到时,启动所述中间功率状态;/n用所述第二处理器生成一个或多个第二置信度得分,其中所述一个或多个第二置信度得分中的每一个是每一个记录的非触觉输入与基准输入之间相似度的量度;/n当所述第二置信度得分高于第二阈值时,生成指示所述客户端装置执行与所述基准输入相关联的一个或多个操作的命令信号。/n

【技术特征摘要】
20130220 US 61/767,065;20130308 US 13/791,7161.一种方法,其包括:
用一个或多个传感器将一个或多个非触觉输入记录到装置,其中所述一个或多个输入被记录到第一存储器,其中所述装置在低功率状态下运行,在所述低功率状态下,电源提供给第一处理器和所述第一存储器;
生成一个或多个第一置信度得分,其中所述一个或多个第一置信度得分中的每一个是对应记录的非触觉输入与存储在所述第一存储器中的基准输入之间相似度的量度;
当所述第一置信度得分高于第一阈值水平时,启动所述装置的中间功率状态,其中所述中间功率状态包括向至少第二处理器提供电源,其中所述第二处理器具有比所述第一处理器更大量的可用处理能力;
当所述第一置信度得分在质询范围内时,输出质询信号,并且当所述质询信号的响应被所述一个或多个传感器检测到时,启动所述中间功率状态;
用所述第二处理器生成一个或多个第二置信度得分,其中所述一个或多个第二置信度得分中的每一个是每一个记录的非触觉输入与基准输入之间相似度的量度;
当所述第二置信度得分高于第二阈值时,生成指示所述客户端装置执行与所述基准输入相关联的一个或多个操作的命令信号。


2.根据权利要求1所述的方法,其中所述一个或多个传感器中的第一传感器是麦克风。


3.根据权利要求2所述的方法,其中生成所述第一置信度得分包括用话音活动检测(VAD)算法来分析所述非触觉输入中的一个或多个。


4.根据权利要求3所述的方法,其中所述VAD算法通过专用集成电路(ASIC)来实施。


5.根据权利要求2所述的方法,其中生成所述第一置信度得分包括用自动语音识别算法来分析所述非触觉输入中的一个或多个。


6.根据权利要求2所述的方法,其中生成所述一个或多个第一置信度得分包括用话音活动检测(VAD)算法和自动语音识别算法来分析所述非触觉输入中的一个或多个。


7.根据权利要求2所述的方法,其中所述一个或多个传感器中的第二传感器经配置检测所述客户端装置平台附近人的存在。


8.根据权利要求7所述的方法,其中所述经配置检测所述客户端装置平台附近人的存在的传感器是视频摄像机。


9.根据权利要求7所述的方法,其中所述经配置检测所述客户端装置平台附近人的存在的传感器是红外摄像机。


10.根据权利要求7所述的方法,其中所述经配置检测所述客户端装置平台附近人的存在的传感器是太赫兹传感器。


11.根据权利要求2所述的方法,其中生成所述一个或多个第二置信度得分包括用自动语音识别算法来分析所述非触觉输入中的一个或多个,其中所述自动语音识别算法利用音标。


12.根据权利要求2所述的方法,其中生成所述第二置信度得分包括用自动语音识别算法来分析所述非触觉输入中的一个或多个,其中所述自动语音识别算法利用听觉注意提示。


13.根据权利要求2所述的方法,其中生成所述第二置信度得分包括用话音识别算法来分析所述非触觉输入中的一个或多个以识别特定人的声音。


14.根据权利要求1所述的方法,其中所述一个或多个传感器中的一个传感器是视频摄像机。


15.根据权利要求14所述的方法,其中生成所述第一置信度得分包括用对象识别算法来分析所述非触觉输入中的一个或多个。


16.根据权利要求15所述的方法,其中所述对象识别算法经配置检测所述客户端装置平台附近人的存在。


17.根据权利要求14所述的方法,其中生成所述第一置信度得分包括用手势识别算法来分析所述非触觉输入中的一个或多个。


18.根据权利要求14所述的方法,其中生成所述第二置信度得分包括用视听语音识别(ASVR)算法来分析所述非触觉输入中的一个或多个。


19.根据权利要求1所述的方法,其中所述一个或多个传感器中的一个传感器是运动传感器,并且其中生成所述第一置信度得分包括执行运动检测。

【专利技术属性】
技术研发人员:DS马林森陈如新
申请(专利权)人:索尼电脑娱乐公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1