提供建议的基于话音的动作查询制造技术

技术编号:23445660 阅读:16 留言:0更新日期:2020-02-28 19:53
本发明专利技术涉及提供建议的基于话音的动作查询。本公开的技术可促进用户发现能够被口述以发起基于计算机的动作的各种基于话音的动作查询,诸如能够作为口述输入提供到计算装置以发起基于计算机的动作的基于话音的动作查询,所述基于话音的动作查询是针对所述用户在所述计算装置上观看或以其它方式消费的内容来特别指出的。一些具体实施一般涉及鉴于用户最近在计算装置上观看的内容来确定至少一个建议的基于话音的动作查询用于经由所述计算装置呈现。一些具体实施额外地或另选地一般涉及在计算装置处接收至少一个建议的基于话音的动作查询并且响应于用于发起经由所述计算装置提供基于话音的查询的输入而提供所述建议的基于话音的动作查询作为建议。

Voice based action query with suggestions

【技术实现步骤摘要】
提供建议的基于话音的动作查询分案说明本申请属于申请日为2016年5月26日的中国专利技术专利申请No.201680019315.8的分案申请。
技术介绍
话音查询应用正越来越多地用于计算装置控制。话音查询应用的一种使用是用于诸如移动电话、手表、平板计算机、头戴式装置、虚拟或增强现实装置、车载电子系统(例如,并入有导航和音频能力的汽车系统)等便携式计算装置。许多话音查询应用已经发展到对自然语言请求做出响应且/或管理与用户的来回对话或会话。许多话音查询应用并入有将人类话音的音频记录转换为文本的初始语音至文本转换以及对文本进行分析以尝试确定用户请求的含义的语义分析。基于用户口述输入的所确定含义,可采取基于计算机的动作,诸如执行搜索、提供行驶方向或以其它方式控制计算装置的一个或多个应用。话音查询应用的流行度和/或能力已经增大并且可以继续增大。然而,在很多情况下,用户可能没有充分认识到用户所利用的计算装置的话音查询应用所提供的能力。
技术实现思路
本说明书的技术的一些具体实施可促进用户发现能够被口述以发起基于计算机的动作的各种基于话音的动作查询,诸如能够提供作为口述输入到计算装置以发起基于计算机的动作的基于话音的动作查询,所述基于话音的动作查询是针对所述用户在所述计算装置上观看或以其它方式消费的内容来特别指出的。本说明书的一些具体实施大体上针对于鉴于用户最近在计算装置上观看的内容来确定至少一个建议的基于话音的动作查询用于经由所述计算装置呈现。所述建议的基于话音的动作查询指示能够被口述以发起执行针对于所述内容的一个或多个方面的基于计算机的动作的话音查询。所述技术的一些具体实施额外地或另选地大体上针对于在计算装置处接收至少一个建议的基于话音的动作查询并且响应发起经由所述计算装置提供基于话音查询的输入,从而提供所述建议的基于话音的动作查询作为建议。所提供的建议的基于话音的动作查询可为针对在所述计算装置上当前且/或最近可见的内容特别指出的,并且可基于对所述计算装置所提供的内容的指示来生成。在一些具体实施中,可响应于发起基于话音的查询的用户输入(例如,选择话音查询界面元件或口述发起基于话音的查询的短语)并且基于在那个输入之后跟随有对需要建议的基于话音的动作查询的指示来呈现建议的基于话音的动作查询。在那些具体实施中的一些具体实施中,对所述需要建议的基于话音的动作查询的指示可包括在发起基于话音的查询的用户输入之后的阈值量时间内缺少来自用户的任何口述输入。例如,在那些具体实施的版本中,可响应于所述用户在发起基于话音的查询的用户输入的四秒(或其它阈值量时间)内不提供任何口述输入来呈现建议的基于话音的动作查询。在一些具体实施中,建议的基于话音的动作查询包括针对最近在所述计算装置上观看的内容(诸如当前在计算装置上观看的内容)的实体特别指出的动作词项和实体词项。在那些具体实施中的一些具体实施中,那些建议的基于话音的动作查询可包括用于实体的通用描述符,诸如用于实体的代词。例如,对于与演员哈里森·福特相关联的实体,建议的基于话音的动作查询可为“告诉我关于他的更多信息”,其中使用“他”来代替哈里森·福特。另外,例如,对于特定饭店,建议的基于话音的动作查询可为“导航到那里”、“给我看看它的菜单”等等,其中使用“那里”和“它的”来代替饭店的特定名称。在一些具体实施中,提供一种方法,其包括从计算装置接收对最近在计算装置上观看的内容的指示。所述方法还包括确定在所述内容中提到的实体并且确定一个或多个电子数据库中的映射到所述实体的基于计算机的动作。所述方法还包括生成建议的基于话音的动作查询,所述建议的基于话音的动作查询包括发起执行基于计算机的动作的至少一个动作词项并且包括基于所述实体来选择的至少一个实体词项。所述方法还包括从计算装置接收基于话音的查询输入指示并且响应于接收到所述基于话音的查询输入指示而将建议的基于话音的动作查询提供到计算装置。所述基于话音的查询输入指示其指示接收到所述用户经由计算装置的用于发起经由计算装置提供基于话音的查询的输入。将建议的基于话音的动作查询提供到计算装置用于作为基于话音的查询的建议来显示。本文所公开的技术的这些和其它具体实施可任选地包括以下特征中的一者或多者。在一些具体实施中,所述方法还包括确定对需要建议的基于话音的动作查询的指示;以及基于确定对所述需要建议的基于话音的动作查询的指示来提供建议的基于话音的动作查询用于作为建议来显示。在那些具体实施中的一些具体实施中,确定对所述需要建议的基于话音的动作查询的指示是基于从用户发起提供基于话音的查询的输入起的阈值量时间内在计算装置处未从用户接收到口述输入。在一些具体实施中,确定对所述需要建议的基于话音的动作查询的指示是基于在用户发起提供基于话音的查询的输入之后由计算装置检测到至少阈值噪声水平。在一些具体实施中,接收对内容的指示包括接收内容的词项和每个词项在内容中的显示属性,并且确定内容中提到的实体包括基于所述词项中的至少一个词项和所述词项在所述内容中的显示属性来确定实体。在一些具体实施中,确定映射到实体的基于计算机的动作包括确定实体的类别,并且识别基于计算机的动作到所述类别的映射。在一些具体实施中,生成基于话音的动作查询包括确定映射到实体的通用描述符,并且使用通用描述符作为所述至少一个实体词项。在那些具体实施中的一些具体实施中,通用描述符是映射到实体的代词。在通用描述符是映射到实体的代词的具体实施的版本中,所述方法还包括识别实体的图像并且将实体的图像提供到计算装置用于作为建议的基于话音的动作查询的注释来显示。在一些具体实施中,所述方法还包括从计算装置接收对计算装置的优选语言的指示。在那些具体实施中的一些具体实施中,生成建议的基于话音的动作查询包括基于动作词项到基于计算机的动作的映射并且基于动作词项到优选语言的映射来选择动作词项。在那些具体实施中的一些具体实施中,生成建议的基于话音的动作查询包括基于优选语言来选择实体词项。在一些具体实施中,所述方法还包括从计算装置接收应用信息。所述应用信息指示以下至少一者:安装在计算装置上的应用,以及安装在计算装置上的应用的版本。在那些具体实施中的一些具体实施中,确定基于计算机的动作包括基于所述基于计算机的动作到以下至少一者的映射来选择基于计算机的动作:安装在计算装置上的应用,以及安装在计算装置上的应用的版本。在一些具体实施中,所述方法还包括接收对生成所述内容的应用的指示。在那些具体实施中的一些具体实施中,确定基于计算机的动作包括基于对生成所述内容的应用的指示来选择基于计算机的动作。在一些具体实施中,在计算装置处选择所述建议的基于话音的动作查询致使计算装置的第一应用执行基于计算机的动作的至少一个方面。在那些具体实施中的一些具体实施中,所述方法还包括:确定所述至少一个电子数据库中的映射到所述实体的额外基于计算机的动作;生成额外建议的基于话音的动作查询,所述额外建议基于话音的动作查询包括发起执行所述额外基于计算机的动作的至少一个额外动作词项并且包括所述至少一个实体词项;以及响应本文档来自技高网...

【技术保护点】
1.一种由一个或多个处理器实现的方法,所述方法包括:/n在计算装置的第一应用正显示内容时接收用于发起经由所述计算装置提供基于话音的查询的输入;/n基于所述第一应用当前正显示的内容,生成建议的基于话音的动作查询,所述建议的基于话音的动作查询能够被讲出以发起基于计算机的动作的执行;/n响应于接收用于发起提供所述基于话音的查询的所述输入:/n使得所述计算装置的第二应用在由所述第一应用当前正显示的内容之上显示界面元素,其中,所述界面元素包括所生成的建议的基于话音的动作查询的可选择显示;/n响应于接收对所述建议的基于话音的动作查询的所述可选择显示的选择:/n使得执行所述建议的基于话音的动作查询的所述基于计算机的动作。/n

【技术特征摘要】
20150527 US 62/167,195;20150724 US 14/808,9191.一种由一个或多个处理器实现的方法,所述方法包括:
在计算装置的第一应用正显示内容时接收用于发起经由所述计算装置提供基于话音的查询的输入;
基于所述第一应用当前正显示的内容,生成建议的基于话音的动作查询,所述建议的基于话音的动作查询能够被讲出以发起基于计算机的动作的执行;
响应于接收用于发起提供所述基于话音的查询的所述输入:
使得所述计算装置的第二应用在由所述第一应用当前正显示的内容之上显示界面元素,其中,所述界面元素包括所生成的建议的基于话音的动作查询的可选择显示;
响应于接收对所述建议的基于话音的动作查询的所述可选择显示的选择:
使得执行所述建议的基于话音的动作查询的所述基于计算机的动作。


2.根据权利要求1所述的方法,其中,用于发起提供基于话音的查询的所述输入是所讲出的短语、所述计算装置的触摸敏感硬件元件的激活或根据所述计算装置的相机执行手势。


3.根据权利要求1所述的方法,其中,所述计算机的动作的执行是通过所述计算装置的第三应用来进行的。


4.根据权利要求3所述的方法,其中,生成所述建议的基于话音的动作查询是基于安装在所述计算装置上的所述第三应用,并且基于映射到所述第三应用的所述基于计算机的动作。


5.根据权利要求4所述的方法,其中,生成所述建议的基于话音的动作查询是基于安装在所述计算装置上的所述第三应用的版本,并且基于映射到所述第三应用的所述版本的所述基于计算机的动作。


6.根据权利要求1所述的方法,其中,基于所述第一应用当前正显示的内容生成所述建议的基于话音的动作查询包括:
确定所述内容中提到的实体;
确定在一个或多个电子数据库中所述基于计算机的动作被映射到所述实体;以及
生成所述建议的基于话音的动作查询以包括发起所述基于计算机的动作的执行的至少一个词项以及包括基于所述实体选择的至少一个实体词项。


7.根据权利要求6所述的方法,其中,生成所述建议的基于话音的动作查询包括确定映射到所述实体的代词,并且使用所述代词作为所述至少一个实体词项。


8.根据权利要求6所述的方法,其中,生成所述建议的基于话音的动作查询包括确定所述计算装置的优选语言,并且基于所述计算装置的优选语言生成所述建议的基于话音的动作查询。


9.根据权利要求1所述的方法,其中,所述第二应用被集成为所述计算装置的操作系统的一部分。


10.根据权利要求1所述的方法,其中,在所述界面元素中包括所述建议的基于话音的动作查询的所述可选择显示是基于在所述用户的用于发起提供所述基于话音的动作查询的所述输入之后所述计算装置检测到至少阈值噪声水平。


11.根据权利要求1所述的方法,其中,在所述界面元素中包括所述建议的基于话音的动作查询的所述可选择显示是基于检测在所述用户的用于发起提供所述基于话音的动作查询的所述输入之后的阈值时间量内未接收到所讲出的输入。


12.一种系统,包括:
一个或多个处理器;以及
与所述一个或多个处理器操作地耦合的存储器,其中,所述存储器存储指令,响应于一个或多个处理器对所述指令的执行,所述指令使得所述一个或多个处理器:
在第一应用正显示内容时接收用于发起提供基于话音的查询的输入;
基于所述第一应用当前正显示的内容,生成建议的基于话音的动作查询,所述建议的基于话音的动作查询能够被讲出以发起基于计算机的动作的执行;
响应于接收用于发起提供所述基于话音的查询的所述输入:
使得第二应用在由所述第一应用当前正显示的内容之上显示界面元素,其中,...

【专利技术属性】
技术研发人员:维克拉姆·阿加尔瓦尔普拉维尔·库马尔·古普塔
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1