The application involves processing voice commands based on the device topology. The exemplary aspects of the present disclosure are related to processing voice commands or words. For example, data that represents speech speech can be received. The device topology representation can be accessed. The topology structure of the device indicates that a number of intelligent devices associated with one or more buildings can be defined. The device topology indicates that the position of each of the devices in the related building can be further defined. The transcription of the speech utterance can be determined at least in part, based on the representation of the device topology. At least one or more selected devices and one or more actions to be executed by one or more selected devices can be determined, at least in part, based on the determined transcripts and the device topology.
【技术实现步骤摘要】
基于装置拓扑结构来处理语音命令
本公开总的涉及解译语音话语,更具体地说,涉及基于装置的拓扑结构来解译语音话语。
技术介绍
智能、多感应网络连接装置不断地扩散,如扬声器、家庭报警器、门锁、摄像头、照明系统、跑步机、重量秤、智能床、灌溉系统、车库门开启器、家电、婴儿监护仪、火灾报警器等。这些智能装置可以例如位于建筑物的范围内,并且用户可能希望与这种智能装置交互。为此,用户可以使用控制装置来例如经由网络与智能装置进行无线通信。在一些情况下,用户可能希望通过向控制装置提供语音命令或话语来与一个或多个智能装置进行通信。常规的语音命令处理技术使用各种合适的自动语音识别、自然语言处理和/或自然语言理解技术来处理和解译语音话语,并根据语音话语来控制智能装置。然而,这种常规技术通常不能解译复杂的语音话语,并且可能需要来自用户的更多信息的请求。特别地,这样的常规技术通常缺乏对智能家居网络内的装置以及网络内这些装置之间关系的充分了解。
技术实现思路
本公开的实施例的方面和优点将部分地在以下描述中阐述,或者可以从描述中获悉,或者可以通过实践实施例来了解。本公开的一个示例方面涉及一种处理语音话 ...
【技术保护点】
一种由计算机实施的处理语音话语的方法,所述方法包括:由一个或多个计算装置接收表示语音话语的数据,所述语音话语由用户提供给控制装置;由所述一个或多个计算装置访问装置拓扑结构表示,所述装置拓扑结构表示定义与一个或多个建筑物相关联的多个智能装置,所述装置拓扑结构表示进一步定义所述多个装置中的每一个装置在所述相关联的建筑物内的位置;由所述一个或多个计算装置至少部分地基于所述装置拓扑结构表示来确定所述语音话语的转录;以及由所述一个或多个计算装置至少部分地基于所确定的转录和所述装置拓扑结构表示来确定一个或多个所选择的装置和待由所述一个或多个所选择的装置执行的一个或多个动作。
【技术特征摘要】
2016.10.03 US 62/403,4411.一种由计算机实施的处理语音话语的方法,所述方法包括:由一个或多个计算装置接收表示语音话语的数据,所述语音话语由用户提供给控制装置;由所述一个或多个计算装置访问装置拓扑结构表示,所述装置拓扑结构表示定义与一个或多个建筑物相关联的多个智能装置,所述装置拓扑结构表示进一步定义所述多个装置中的每一个装置在所述相关联的建筑物内的位置;由所述一个或多个计算装置至少部分地基于所述装置拓扑结构表示来确定所述语音话语的转录;以及由所述一个或多个计算装置至少部分地基于所确定的转录和所述装置拓扑结构表示来确定一个或多个所选择的装置和待由所述一个或多个所选择的装置执行的一个或多个动作。2.根据权利要求1所述的由计算机实施的方法,其中,由所述一个或多个计算装置来确定所述语音话语的所述转录包括:由所述一个或多个计算装置向通用语言模型提供表示所述语音话语的数据;由所述一个或多个计算装置至少部分地基于所述通用语言模型来确定所述语音话语的第一转录;以及由所述一个或多个计算装置来确定与所述第一转录相关联的第一置信度分数。3.根据权利要求1所述的由计算机实施的方法,其中,由所述一个或多个计算装置来确定所述语音话语的所述转录包括:由所述一个或多个计算装置向个性化语言模型提供表示所述语音话语的所述数据,所述个性化语言模型至少部分地基于所述装置拓扑结构表示来确定;由所述一个或多个计算装置至少部分地基于所述个性化语言模型来确定所述语音话语的第二转录;由所述一个或多个计算装置来确定与所述第二转录相关联的第二置信度分数;以及由所述一个或多个计算装置至少部分地基于所述第一和第二置信度分数来选择要解译的所述第一转录或所述第二转录。4.根据任一前述权利要求所述的由计算机实施的方法,其中,由所述一个或多个计算装置来确定一个或多个所选择的装置和一个或多个动作包括:至少部分地基于与所述用户相关联的上下文数据来确定所述一个或多个所选择的装置和所述一个或多个动作。5.根据权利要求4所述的由计算机实施的方法,其中,与所述用户相关联的所述上下文数据包括相对于在所述装置拓扑结构表示中指定的一个或多个装置的位置的、与所述用户相关联的位置数据。6.根据任一前述权利要求所述的由计算机实施的方法,其中,所述装置拓扑结构表示定义所述一个或多个建筑物中的每一个建筑物内的一个或多个房间,并且其中所述多个装置中的每一个装置的位置对应于所述一个或多个房间中的至少一个房间。7.根据任一前述权利要求所述的由计算机实施的方法,其中,所述装置拓扑结构表示针对每一个智能装置都指定一个或多个装置标识和一个或多个装置属性。8.根据权利要求7所述的由计算机实施的方法,其中,由所述一个或多个计算装置来确定一个或多个所选择的装置和一个或多个动作包括:至少部分地基于在所述装置拓扑结构表示中指定的所述一个或多个装置标识中的至少一个装置标识来确定所述一个或多个所选择的装置和所述一个或多个动作。9.根据权利要求7或权利要求8所述的由计算机实施的方法,其中,由所述一个或多个计算装置来确定一个或多个所选择的装置和一个或多个动作包括:至少部分地基于在所述装置拓扑结构表示中指定的所述一个或多个装置属性中的至少一个装置属性来确定所述一个或多个所选择的装置和所述一个或多个动作。10.根据任一前述权利要求所述的由计算机实施的方法,还包括:由所述一个或多个计算装置至少部分地基于所述一个或多个所选择的装置和所述一个或多个动作来确定一个或多个控制...
【专利技术属性】
技术研发人员:巴纳比·约翰·詹姆斯,大卫·罗伊·沙伊雷尔,艾米·林恩·鲍德温,文森特·扬顿·莫,杨军,马克·斯帕特斯四世,钟磊,
申请(专利权)人:谷歌公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。