语音交互方法、装置、终端设备及介质制造方法及图纸

技术编号:26381149 阅读:77 留言:0更新日期:2020-11-19 23:49
本发明专利技术适用于人工智能技术领域,提供了一种语音交互方法、装置、终端设备及介质,该方法包括:接收用户发出的语音信息;通过N个语音识别器,分别对语音信息进行识别处理,得到N个第一识别结果;选取N个第一识别结果中的优选识别结果,并将优选识别结果分别输入至预设的M个NLP处理器,以输出M个第二识别结果;在M个第二识别结果中,筛选出与预设策略表的节点相匹配的第二识别结果;将筛选出的第二识别结果传递给预设的语音播报器,以通过语音播报器播报语音信息。本发明专利技术中,用户能够基于多样化的语音语义服务提供商来获得更加全面的语音交互响应数据,因而在提高了语音交互准确率的同时,也进一步提高了智能音箱的用户体验度以及用户粘度。

【技术实现步骤摘要】
语音交互方法、装置、终端设备及介质
本专利技术属于人工智能
,尤其涉及一种语音交互方法、装置、终端设备及计算机可读存储介质。
技术介绍
智能音箱,是一个音箱升级的产物,是家庭消费者用语音进行上网的一个工具,比如点播歌曲、上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。由于智能音箱需要依赖于用户发出的语音信息来进行操作控制,因此,语音识别准确率是影响智能音箱性能的一个关键因素。随着智能音箱类产品的不断发展,用户对于语音交互服务的需求也在不断扩大。由于每款智能音箱的语音交互方式通常都是固定的,因此,若此类固定的语音交互服务不足以满足用户,或者用户想要探索更加有趣的语音交互方式,体验不同产品的语音交互特点,则势必要购买多款智能音箱类产品。然而,多款智能音箱在同时使用时又会造成相互间的交互困难,不同的智能音箱在处理同一语音信息时,容易会出现语义理解误差,从而出现各类用户体验类问题,降低了智能音箱的用户粘度。
技术实现思路
有鉴于此,本专利技术实施例提供了一种语音交互方法、装置、终端设备及计算机可读存储介质,以解决现有技术中,语音交互准确率较为低下的问题。本专利技术实施例的第一方面提供了一种语音交互方法,包括:接收用户发出的语音信息;通过预设的N个语音识别器,分别对所述语音信息进行识别处理,得到N个第一识别结果;选取所述N个第一识别结果中的优选识别结果,并将所述优选识别结果分别输入至预设的M个NLP处理器,以输出M个第二识别结果;在所述M个第二识别结果中,筛选出与预设策略表的节点相匹配的所述第二识别结果,所述策略表预置有用户喜好历史模型;将所述筛选出的第二识别结果传递给预设的语音播报器,以通过所述语音播报器播报语音信息;其中,所述N和M均为大于零的整数。本专利技术实施例的第二方面提供了一种语音交互装置,包括:接收单元,用于接收用户发出的语音信息;识别单元,用于通过预设的N个语音识别器,分别对所述语音信息进行识别处理,得到N个第一识别结果;选取单元,用于选取所述N个第一识别结果中的优选识别结果,并将所述优选识别结果分别输入至预设的M个NLP处理器,以输出M个第二识别结果;筛选单元,用于在所述M个第二识别结果中,筛选出与预设策略表的节点相匹配的所述第二识别结果,所述策略表预置有用户喜好历史模型;播报单元,用于将所述筛选出的第二识别结果传递给预设的语音播报器,以通过所述语音播报器播报语音信息;其中,所述N和M均为大于零的整数。本专利技术实施例的第三方面提供了一种终端设备,包括存储器以及处理器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述语音交互方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述处理器执行所述计算机程序时实现如上述语音交互方法的步骤。本专利技术实施例中,在接收到用户发出的语音信息时,通过利用识别能力各异的N个语音识别器来对该语音信息进行识别处理,能够获得不同语音服务提供商所提供的语音识别结果;通过进一步选取出其中优选识别结果,能够提高语音识别的准确率,满足用户对于多样化的语音交互服务的需求;在语音识别完成后,通过利用NLP处理器来再次处理当前的语音识别结果,使得智能音箱能够准确理解用户所发出的控制命令,保证了用户能获得更为准确的语音交互响应数据,从技术层面提供用户无感知而且更加高效的用户体验。本专利技术实施例中,由于用户能够基于多样化的语音语义服务提供商来获得更加全面的语音交互响应数据,因而在提高了语音交互准确率的同时,也进一步提高了智能音箱的用户体验度以及用户粘度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的语音交互方法的实现流程图;图2是本专利技术实施例提供的语音交互方法S104的具体实现流程图;图3是本专利技术实施例提供的语音交互方法S1043的具体实现流程图;图4是本专利技术实施例提供的语音交互方法S1044的具体实现流程图;图5是本专利技术实施例提供的语音交互装置的结构框图;图6是本专利技术实施例提供的终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。在本专利技术的各个实施例中,流程的执行主体为智能音箱。值得注意的是,除了智能音箱之外,本专利技术所提供的语音交互方法还适应于其他包含语音识别技术的应用场景,在此不作限定。图1示出了本专利技术实施例提供的语音交互方法的实现流程,详述如下:在S101中,接收用户发出的语音信息。本专利技术实施例中,通过预置的语音拾取器,采集目标范围内的语音信息。其中,语音拾取器可以是内置的话筒,也可以是信号接收器。当上述语音拾取器为内置的话筒时,令该话筒时刻处于工作状态,并持续检测目标范围内的声音信号。若检测到当前声音信号的振幅值大于预设阈值,则将该段声音信号记录为用户发出的语音信息。当上述语音拾取器为信号接收器时,其用于接收远程设备所转发过来的模拟信号,以对远程用户所传输的语音信息进行捕获。在S102中,通过预设的N个语音识别器,分别对所述语音信息进行识别处理,得到N个第一识别结果。本专利技术实施例中,将接收到的语音信息传输至内部集成的N(N为大于零的整数)个语音识别器,或者,根据预存储的各个网络地址,将语音信息分别发送至与网络地址对应的各个语音识别器。其中,每一个语音识别器与一个平台的语音识别服务商关联,即,每一语音识别器具有一语音识别服务商所特定的语音处理方式。本专利技术实施例中,令N个语音识别器分别对接收到的语音信息进行语音识别处理,以将基于模拟信号的语音信息转换为文本信息。由于每一语音识别器在对语音信息进行识别处理后能够得到一个识别结果,因此,对于N个语音识别器,能够输出N个识别结果。可选地,若上述N等于一,则确定出预先指定的一个语音识别器,并令该语音识别器对当前接收到的语音信息进行识别处理。上述预先指定的一个语音识别器可根据用户发出的设置指令来确定。可选地,获取智能音箱所属的地理区域,根据该地理区域所对应的语言类别,确定与该语言类别相符的一个或多个语音识别器。例如,若智能音箱所属的地理区域为香港,则其对应的语言类本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:/n接收用户发出的语音信息;/n通过预设的N个语音识别器,分别对所述语音信息进行识别处理,得到N个第一识别结果;/n选取所述N个第一识别结果中的优选识别结果,并将所述优选识别结果分别输入至预设的M个NLP处理器,以输出M个第二识别结果;/n在所述M个第二识别结果中,筛选出与预设策略表的节点相匹配的所述第二识别结果,所述策略表预置有用户喜好历史模型;/n将所述筛选出的第二识别结果传递给预设的语音播报器,以通过所述语音播报器播报语音信息;/n其中,所述N和M均为大于零的整数。/n

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:
接收用户发出的语音信息;
通过预设的N个语音识别器,分别对所述语音信息进行识别处理,得到N个第一识别结果;
选取所述N个第一识别结果中的优选识别结果,并将所述优选识别结果分别输入至预设的M个NLP处理器,以输出M个第二识别结果;
在所述M个第二识别结果中,筛选出与预设策略表的节点相匹配的所述第二识别结果,所述策略表预置有用户喜好历史模型;
将所述筛选出的第二识别结果传递给预设的语音播报器,以通过所述语音播报器播报语音信息;
其中,所述N和M均为大于零的整数。


2.如权利要求1所述的语音交互方法,其特征在于,所述在所述M个第二识别结果中,筛选出与预设策略表的节点相匹配的所述第二识别结果,包括:
获取每一所述第二识别结果所分别对应的类别领域,并统计每一所述类别领域的出现频次;
确定出所述出现频次最高的所述类别领域所对应的所述第二识别结果;
判断所述确定出的所述第二识别结果与预设的用户喜好历史模型是否存在匹配条件;
若存在,则从所述用户喜好历史模型中,获取与该第二识别结果相对应的匹配条件,并控制所述语音播报器根据所述匹配条件输出语音信息。


3.如权利要求2所述的语音交互方法,其特征在于,所述判断所述确定出的所述第二识别结果与预设的用户喜好历史模型是否存在匹配条件,包括:
根据所述第二识别结果所对应的所述类别领域,加载所述用户喜好历史模型所关联的访问控制列表;
判断确定出的所述第二识别结果是否存在于所述访问控制列表;
若确定出的所述第二识别结果不存在于所述访问控制列表,则确定所述第二识别结果与所述用户喜好历史模型匹配。


4.如权利要求2或3所述的语音交互方法,其特征在于,所述从所述用户喜好历史模型中,获取与该第二识别结果相对应的匹配条件,包括:
若所述确定出的所述第二识别结果与预设的用户喜好历史模型存在匹配条件,则对当前所存在的各项所述匹配条件进行选取;
分别计算所述第二识别结果与各项所述匹配条件的匹配程度;
将所述匹配程度最高的所述匹配条件进行选取。


5.如权利要求1所述的语音交互方法,其特征在于,在所述选取所述N个第一识别结果中的优选识别结果,并将所述优选识别结果分别输入至预设的M个NLP处理器,以输出...

【专利技术属性】
技术研发人员:符兴富廖洪涛熊友军
申请(专利权)人:深圳市优必选科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1