用于实现智能化语音查询的方法和装置制造方法及图纸

技术编号:38465993 阅读:9 留言:0更新日期:2023-08-11 14:43
本申请提供了用于实现智能化语音查询的方法和装置。用于实现智能化语音查询的装置包括:接口电路,用于接收来自用户的语音查询输入;以及处理器,该处理器与接口电路耦合并且被配置用于:对语音查询输入进行自动语音识别和自然语言理解处理以生成结构化查询数据;基于输入适配规则对结构化查询数据进行修改以得到经修改的结构化查询数据;将经修改的结构化查询数据输出给内容提供服务器;并且从内容提供服务器接收与经修改的结构化查询数据相对应的查询结果输出。对应的查询结果输出。对应的查询结果输出。

【技术实现步骤摘要】
用于实现智能化语音查询的方法和装置


[0001]本公开的实施例总体上涉及语音查询,并且更具体地涉及用于实现智能化语音查询的方法和装置。

技术介绍

[0002]语音识别和自然语言理解系统在当今社会中已变得非常普遍。越来越多的日常设备(例如电器、车辆、移动设备等)配备有语音识别和自然语言理解能力。例如,可以在这些日常设备上安装智能语音助手以识别从用户接收的语音查询输入,并提供相应的查询结果输出。通常,智能语音助手自身可能不具有内容提供能力,而是借助于内容提供商来提供针对用户的语音查询的查询结果。具体而言,智能语音助手在接收到来自用户的语音查询输入时,会对语音查询输入进行语音识别和自然语言理解处理以生成结构化查询数据,然后将结构化查询数据输出到内容提供商,由内容提供商进行查询操作并将查询结果返回给智能语音助手,进而反馈给用户。
[0003]基于这种内容查询方式,用户所得到的查询结果基本上是由内容提供商控制。也就是说,用户在通过智能语音助手进行语音查询时的体验主要是由内容提供商提供和推送信息的方式来决定的。而智能语音助手的功能主要还是进行语音识别和自然语言处理,因而智能语音助手对于用户体验的影响非常有限。
[0004]实际上,对于语音查询而言,智能语音助手是直接与用户进行交互的装置,加强智能语音助手对用户体验的影响有利于在语音查询过程中为用户提供更直接的智能化服务。因此,期望开发一种技术,能够使得智能语音助手更多地参与到针对用户的语音查询来提供和推送查询结果和相关信息的过程中,增强语音查询的用户体验。
>
技术实现思路

[0005]本公开的一方面提供了一种用于实现智能化语音查询的装置,包括:接口电路,用于接收来自用户的语音查询输入;以及处理器,该处理器与接口电路耦合并且被配置用于:对语音查询输入进行自动语音识别和自然语言理解处理以生成结构化查询数据;基于输入适配规则对结构化查询数据进行修改以得到经修改的结构化查询数据;将经修改的结构化查询数据输出给内容提供服务器;并且从内容提供服务器接收与经修改的结构化查询数据相对应的查询结果输出。
[0006]本公开的另一方面提供了一种用于实现智能化语音查询的方法,包括:接收来自用户的语音查询输入;对语音查询输入进行自动语音识别和自然语言理解处理以生成结构化查询数据;基于输入适配规则对结构化查询数据进行修改以得到经修改的结构化查询数据;将经修改的结构化查询数据输出给内容提供服务器;并且从内容提供服务器接收与经修改的结构化查询数据相对应的查询结果输出。
[0007]本公开的又一方面提供了一种存储有代码的计算机可读介质,所述代码在由处理器执行时使得所述处理器实现上述用于实现智能化语音查询的方法。
附图说明
[0008]参考以下描述和附图将更好地理解本申请的具体特征、方面和优点,其中:
[0009]图1示出了根据本公开的一些实施例的由语音识别和自然语言处理系统和内容提供服务器构成的语音查询系统的总体构架的框图。
[0010]图2示出了根据本公开的一些实施例的用于实现智能化语音查询的装置的示意性结构框图。
[0011]图3示出了根据本公开的一些实施例的由语音识别和自然语言处理系统和内容提供服务器构成的语音查询系统的总体构架的框图。
[0012]图4示出了根据本公开的一些实施例的用于实现智能化语音查询的方法的流程图。
[0013]图5示出了可以实现智能化语音查询方法的各种组件的示例计算机系统的框图。
具体实施方式
[0014]将使用本领域技术人员通常采用的术语来描述说明性实施例的各个方面,以将本公开的实质传达给本领域其他技术人员。然而,对于本领域技术人员显而易见的是,可以使用所描述方面的部分来实现许多替代实施例。出于说明的目的,提供了具体的数字、材料和配置,以便提供对说明性实施例的透彻理解。然而,对于本领域技术人员显而易见的是,可以在没有具体细节的情况下实现替代实施例。在其他情况下,可以省略或简化众所周知的特征,以避免模糊说明性实施例。
[0015]此外,各种操作将以最有助于理解说明性实施例的方式被描述为依次进行的多个离散操作;然而,描述的顺序不应被解释为暗示这些操作必须依赖于顺序。特别是,这些操作不需要按照呈现的顺序执行。
[0016]在本文中重复使用短语“在一些实施例中”。该短语通常不是指相同的实施例;但是也可能指相同的实施例。除非上下文另有规定,否则术语“包含”、“具有”和“包括”是同义词。短语“A或B”和“A/B”表示“(A)、(B)或(A和B)”。
[0017]智能语音助手被越来越多地安装在日常设备(例如电器、车辆、移动设备等)上以提供智能化的语音查询服务。在本公开中,以安装在车辆上的智能语音助手为示例来描述所提出的技术方案,但是应理解,本公开中所描述的技术方案可以很容易地应用于被安装在其它日常设备上的智能语音助手。
[0018]通常,智能语音助手借助于内容提供商来提供针对用户的语音查询的查询结果。基于这种内容查询方式,用户所得到的查询结果基本上是由内容提供商控制。也就是说,用户在通过智能语音助手进行语音查询时的体验主要是由内容提供商提供和推送信息的方式来决定的。例如,当用户向安装在车辆内的智能语音助手发出语音查询“请告诉我5英里以内的餐馆”时,该语音查询经过智能语音助手的语音识别和自然语言处理之后将被提供给与该车辆关联的诸如Yelp或大众点评之类的内容提供商,然后Yelp或大众点评将根据其内部设定的内容查询、过滤、排序、输出等规则来向用户提供Yelp或大众点评推荐的5英里内的餐馆的列表。因而,用户通过语音查询所得到的餐馆的列表中所包含的餐馆名、餐馆的类型、餐馆的排序或附加的广告推送均是由诸如Yelp或大众点评之类的内容提供商决定的。在这种情况下,智能语音助手只是进行语音识别和自然语言处理,不参与到具体查询过
程中,因此对于内容提供商提供给用户的查询结果输出基本没有控制权。
[0019]在配备有智能语音助手的日常设备中,智能语音助手是直接与用户进行交互的装置,用户所发出的每个语音请求都是首先被智能语音助手接收并理解的,因而在智能语音助手中进行对用户的行为模式(user

s profile)的学习和推测是非常合适的。也就是说,智能语音助手可能是最了解用户的行为模式的装置之一,因此,加强智能语音助手对用户查询体验的影响有利于在语音查询过程中为用户提供更直接的智能化服务。鉴于此方面的考虑,本申请提出了以下技术方案:当智能语音助手接收到用户的语音查询输入时,可以根据预先设定的输入适配规则对语音查询进行修改,然后再将经修改的查询数据提供给内容提供商,从而提供更加智能化的语音查询服务。
[0020]图1示出了根据本公开的一些实施例的由语音识别和自然语言处理系统和内容提供服务器构成的语音查询系统100的总体构架的框图。如图1所示,该语音查询系统100可以包括自动语音识别(ASR)处理器102、自然语言理解(NLU)解析服务器104、自然语言生成(本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于实现智能化语音查询的装置,包括:接口电路,用于接收来自用户的语音查询输入;以及处理器,该处理器与所述接口电路耦合并且被配置用于:对所述语音查询输入进行自动语音识别和自然语言理解处理以生成结构化查询数据;基于输入适配规则对所述结构化查询数据进行修改以得到经修改的结构化查询数据;将所述经修改的结构化查询数据输出给内容提供服务器;并且从所述内容提供服务器接收与所述经修改的结构化查询数据相对应的查询结果输出。2.如权利要求1所述的装置,其中,所述输入适配规则包括基于对所述用户的行为模式的学习和推测而设定的规则。3.如权利要求1所述的装置,其中,所述输入适配规则包括基于与所述语音查询输入相关联的商业推荐而设定的规则。4.如权利要求1所述的装置,其中,所述输入适配规则包括用于将所述用户的所述语音查询输入适配为所述内容提供服务器可理解的结构化查询数据的规则。5.如权利要求1所述的装置,其中,所述内容提供服务器为第一内容提供服务器,从所述第一内容提供服务器接收的所述查询结果输出为第一查询结果输出,并且所述处理器还被配置用于:将所述经修改的结构化查询数据输出给第二内容提供服务器;从所述第二内容提供服务器接收与所述经修改的结构化查询数据相对应的第二查询结果输出;基于输出整合规则对所述第一查询结果输出和所述第二查询结果输出进行整合,以生成经整合的查询结果输出作为所述查询结果输出。6.如权利要求5所述的装置,其中,所述输出整合规则包括基于对所述用户的行为模式的学习和推测而设定的规则。7.如权利要求5所述的装置,其中,所述输出整合规则包括基于与所述查询结果输出相关联的商业推荐而设定的规则。8.如权利要求1至7中任一项所述的装置,其中,所述处理器还被配置用于:对所述查询结果输出进行自然语言生成处理以生成用于反馈给所述用户的语音查询结果输出。9.如权利要求8所述的装置,其中,所述处理器还被配置用于:基于所述语音查询输入对所述语音查询结果输出进行修改,以生成与所述语音查询输入相匹配的语音查询结果输出。10.如权利要求8所述的装置,其中,所述处理器还被配置用于:在所述语音查询结果输出被反馈给所述用户之前,基于输出适配规则对所述语音查询结果输出进行修改。11.如权利要求10所述的装置,其中,所述输出适配规则包括基于对所述用户的行为模式的学习和推测而设定的规则。12.如权利要求10所述的装置,其中,所述输出适配规则包括基于与所述语音查询结果输出相关联的商业推荐而设定的规则。13.一种用于...

【专利技术属性】
技术研发人员:王冲
申请(专利权)人:声音猎手公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1