用于推送信息的方法和装置制造方法及图纸

技术编号:17117397 阅读:17 留言:0更新日期:2018-01-25 00:20
本申请公开了用于推送信息的方法和装置。该方法的一具体实施方式包括:接收用户通过终端发送的语音信息,语音信息包括唤醒用语音信息和查询用语音信息;对唤醒用语音信息进行声纹特征提取,得到声纹特征信息;将声纹特征信息与预先设定的注册声纹信息集合进行匹配,注册声纹信息集合中的各注册声纹信息包括注册声纹特征信息、以及与注册声纹特征信息对应的注册用户的用户行为数据;响应于声纹特征信息与注册声纹信息集合中的注册声纹特征信息匹配成功,基于查询用语音信息以及匹配成功的注册声纹特征信息对应的用户行为数据向终端推送音频信息。该实施方式实现了富有针对性的信息推送,满足了用户的个性化需求。

Methods and devices for pushing information

The present application discloses a method and device for pushing information. One embodiment of the method includes: receiving user terminal by sending voice information, voice information including wakeup speech information and query voice information; extraction of wake voiceprint characteristics with voice information, get voiceprint information; collection of voiceprint feature information and a predetermined registration information, the registration of voice, voice the registration information collection voiceprint information including registration information, voiceprint and user behavior data corresponding to a registered voiceprint registered user information; in response to the information registered voiceprint set in voiceprint information and registration information query, voiceprint, voice information and user behavior data corresponding to the registration information, the success of the voiceprint based on the push of audio information to the terminal. The implementation method realizes the targeted information push, and meets the user's personalized needs.

【技术实现步骤摘要】
用于推送信息的方法和装置
本申请涉及计算机
,具体涉及互联网
,尤其涉及用于推送信息的方法和装置。
技术介绍
近年来,人工智能技术有了深远的发展,并逐步实现产品化。特别是智能语音对话产品,例如,智能音箱、智能机器人等等。包括智能音箱、智能机器人等在内的智能语音对话产品的典型使用场景是在家庭之中,家庭用户可以使用语音与智能语音对话产品进行交互,提出服务请求,智能语音对话产品则使用一套通用应答规则为家庭用户提供服务。然而,每个家庭中往往有多个用户,每个用户必然会有不同的需求,因此,如何识别出家庭用户中的各个用户,并为各个用户提供满足其个性化需求服务是急需解决的问题。
技术实现思路
本申请的目的在于提出一种改进的用于推送信息的方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请实施例提供了一种用于推送信息的方法,该方法包括:接收用户通过终端发送的语音信息,其中,上述语音信息包括唤醒用语音信息和查询用语音信息,其中,上述唤醒用语音信息用于将上述终端从待机状态切换为唤醒状态;对上述唤醒用语音信息进行声纹特征提取,得到声纹特征信息;将上述声纹特征信息与预先设定的注册声纹信息集合进行匹配,其中,上述注册声纹信息集合中的各注册声纹信息包括注册声纹特征信息、以及与上述注册声纹特征信息对应的注册用户的用户行为数据;响应于上述声纹特征信息与上述注册声纹信息集合中的注册声纹特征信息匹配成功,基于上述查询用语音信息以及匹配成功的注册声纹特征信息对应的用户行为数据向上述终端推送音频信息。在一些实施例中,上述方法还包括:响应于上述声纹特征信息与上述注册声纹信息集合中的注册声纹信息匹配不成功,确定上述注册声纹信息集合中包含的注册声纹信息条数是否超过预先设定的数量阈值;如果超过,则删除上述注册声纹信息集合中的、用户行为数据最少的注册声纹信息;根据上述唤醒用语音信息建立上述用户的注册声纹信息,并将建立的注册声纹信息存入上述注册声纹信息集合中。在一些实施例中,上述根据上述唤醒用语音信息建立上述用户的注册声纹信息,包括:将上述唤醒用语音信息导入预先训练的通用背景模型中进行映射得到第一声纹特征超向量,其中,上述通用背景模型用于表征语音信息与声纹特征超向量的对应关系;将上述第一声纹特征超向量经过降维处理得到第一注册声纹特征信息;生成上述第一注册声纹特征信息的第一声纹标识,并将上述用户的用户行为数据与上述第一声纹标识关联存储;将上述第一注册声纹特征信息、第一声纹标识以及上述用户的用户行为数据作为上述用户的注册声纹信息。在一些实施例中,上述对上述唤醒用语音信息进行声纹特征提取,得到声纹特征信息,包括:将上述唤醒用语音信息导入预先训练的通用背景模型中进行映射得到声纹特征超向量,其中,上述通用背景模型用于表征语音信息与声纹特征超向量的对应关系;将上述声纹特征超向量经过降维处理得到声纹特征信息。在一些实施例中,上述注册声纹信息集合中的各注册声纹信息还包括与注册声纹特征信息对应的声纹标识;以及对于上述注册声纹信息集合中的每条注册声纹信息,该注册声纹信息中包括的注册声纹特征信息、用户行为数据与该注册声纹信息的声纹标识关联存储。第二方面,本申请实施例提供了一种用于推送信息的装置,该装置包括:接收单元,用于接收用户通过终端发送的语音信息,其中,上述语音信息包括唤醒用语音信息和查询用语音信息,其中,上述唤醒用语音信息用于将上述终端从待机状态切换为唤醒状态;提取单元,用于对上述唤醒用语音信息进行声纹特征提取,得到声纹特征信息;匹配单元,用于将上述声纹特征信息与预先设定的注册声纹信息集合进行匹配,其中,上述注册声纹信息集合中的各注册声纹信息包括注册声纹特征信息、以及与上述注册声纹特征信息对应的注册用户的用户行为数据;推送单元,用于响应于上述声纹特征信息与上述注册声纹信息集合中的注册声纹特征信息匹配成功,基于上述查询用语音信息以及匹配成功的注册声纹特征信息对应的用户行为数据向上述终端推送音频信息。在一些实施例中,上述装置还包括:确定单元,用于响应于上述声纹特征信息与上述注册声纹信息集合中的注册声纹信息匹配不成功,确定上述注册声纹信息集合中包含的注册声纹信息条数是否超过预先设定的数量阈值;删除单元,用于如果超过,则删除上述注册声纹信息集合中的、用户行为数据最少的注册声纹信息;注册单元,用于根据上述唤醒用语音信息建立上述用户的注册声纹信息,并将建立的注册声纹信息存入上述注册声纹信息集合中。在一些实施例中,上述注册单元进一步用于:将上述唤醒用语音信息导入预先训练的通用背景模型中进行映射得到第一声纹特征超向量,其中,上述通用背景模型用于表征语音信息与声纹特征超向量的对应关系;将上述第一声纹特征超向量经过降维处理得到第一注册声纹特征信息;生成上述第一注册声纹特征信息的第一声纹标识,并将上述用户的用户行为数据与上述第一声纹标识关联存储;将上述第一注册声纹特征信息、第一声纹标识以及上述用户的用户行为数据作为上述用户的注册声纹信息。在一些实施例中,上述提取单元进一步用于:将上述唤醒用语音信息导入预先训练的通用背景模型中进行映射得到声纹特征超向量,其中,上述通用背景模型用于表征语音信息与声纹特征超向量的对应关系;将上述声纹特征超向量经过降维处理得到声纹特征信息。在一些实施例中,上述注册声纹信息集合中的各注册声纹信息还包括与注册声纹特征信息对应的声纹标识;以及对于上述注册声纹信息集合中的每条注册声纹信息,该注册声纹信息中包括的注册声纹特征信息、用户行为数据与该注册声纹信息的声纹标识关联存储。第三方面,本申请实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于推送信息的方法和装置,通过对用户发送的唤醒用语音信息进行声纹特征提取,得到用户的声纹特征信息,而后将用户的声纹特征信息与注册声纹信息集合进行匹配,最后响应于用户的声纹特征信息与注册声纹信息集合中的注册声纹特征信息匹配成功,基于用户发送的查询用语音信息以及匹配成功的注册声纹特征信息对应的用户行为数据向用户所使用的终端推送音频信息,从而识别出了不同用户,实现了富有针对性的信息推送,满足了用户的个性化需求。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于推送信息的方法的一个实施例的流程图;图3是根据本申请的用于推送信息的方法的一个应用场景的示意图;图4是根据本申请的用于推送信息的装置的一个实施例的结构示意图;图5是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关本文档来自技高网...
用于推送信息的方法和装置

【技术保护点】
一种用于推送信息的方法,其特征在于,所述方法包括:接收用户通过终端发送的语音信息,其中,所述语音信息包括唤醒用语音信息和查询用语音信息,其中,所述唤醒用语音信息用于将所述终端从待机状态切换为唤醒状态;对所述唤醒用语音信息进行声纹特征提取,得到声纹特征信息;将所述声纹特征信息与预先设定的注册声纹信息集合进行匹配,其中,所述注册声纹信息集合中的各注册声纹信息包括注册声纹特征信息、以及与所述注册声纹特征信息对应的注册用户的用户行为数据;响应于所述声纹特征信息与所述注册声纹信息集合中的注册声纹特征信息匹配成功,基于所述查询用语音信息以及匹配成功的注册声纹特征信息对应的用户行为数据向所述终端推送音频信息。

【技术特征摘要】
1.一种用于推送信息的方法,其特征在于,所述方法包括:接收用户通过终端发送的语音信息,其中,所述语音信息包括唤醒用语音信息和查询用语音信息,其中,所述唤醒用语音信息用于将所述终端从待机状态切换为唤醒状态;对所述唤醒用语音信息进行声纹特征提取,得到声纹特征信息;将所述声纹特征信息与预先设定的注册声纹信息集合进行匹配,其中,所述注册声纹信息集合中的各注册声纹信息包括注册声纹特征信息、以及与所述注册声纹特征信息对应的注册用户的用户行为数据;响应于所述声纹特征信息与所述注册声纹信息集合中的注册声纹特征信息匹配成功,基于所述查询用语音信息以及匹配成功的注册声纹特征信息对应的用户行为数据向所述终端推送音频信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述声纹特征信息与所述注册声纹信息集合中的注册声纹信息匹配不成功,确定所述注册声纹信息集合中包含的注册声纹信息条数是否超过预先设定的数量阈值;如果超过,则删除所述注册声纹信息集合中的、用户行为数据最少的注册声纹信息;根据所述唤醒用语音信息建立所述用户的注册声纹信息,并将建立的注册声纹信息存入所述注册声纹信息集合中。3.根据权利要求2所述的方法,其特征在于,所述根据所述唤醒用语音信息建立所述用户的注册声纹信息,包括:将所述唤醒用语音信息导入预先训练的通用背景模型中进行映射得到第一声纹特征超向量,其中,所述通用背景模型用于表征语音信息与声纹特征超向量的对应关系;将所述第一声纹特征超向量经过降维处理得到第一注册声纹特征信息;生成所述第一注册声纹特征信息的第一声纹标识,并将所述用户的用户行为数据与所述第一声纹标识关联存储;将所述第一注册声纹特征信息、第一声纹标识以及所述用户的用户行为数据作为所述用户的注册声纹信息。4.根据权利要求1所述的方法,其特征在于,所述对所述唤醒用语音信息进行声纹特征提取,得到声纹特征信息,包括:将所述唤醒用语音信息导入预先训练的通用背景模型中进行映射得到声纹特征超向量,其中,所述通用背景模型用于表征语音信息与声纹特征超向量的对应关系;将所述声纹特征超向量经过降维处理得到声纹特征信息。5.根据权利要求1所述的方法,其特征在于,所述注册声纹信息集合中的各注册声纹信息还包括与注册声纹特征信息对应的声纹标识;以及对于所述注册声纹信息集合中的每条注册声纹信息,该注册声纹信息中包括的注册声纹特征信息、用户行为数据与该注册声纹信息的声纹标识关联存储。6.一种用于推送信息的装置,其特征在于,所述装置包括:接收单元,用于接收用户通过终端发送的语音信息,其中,所述语音信息包括唤醒用语音信息和查询用语音信息,其中,所述唤醒...

【专利技术属性】
技术研发人员:王文宇
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1