一种信息识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25992632 阅读:32 留言:0更新日期:2020-10-20 19:01
本申请提供了一种信息识别方法、装置、电子设备及存储介质,其中,该方法包括:获取待识别音频;确定表征待识别音频的声学特征的特征向量;基于特征向量以及预先训练的信息识别模型,得到待识别音频对应的服务标签;依据服务标签确定出与服务标签相匹配的服务信息。本申请实施例通过信息识别模型识别出待识别音频对应的服务标签,进而依据服务标签为用户匹配服务信息,从而在用户无感知的情况下为用户提供更适合的服务,使用户享受服务的同时不会给用户带来负担,提高了用户体验。

【技术实现步骤摘要】
一种信息识别方法、装置、电子设备及存储介质
本申请涉及互联网
,具体而言,涉及一种信息识别方法、装置、电子设备及存储介质。
技术介绍
随着科技的发展,互联网技术已经渗透到人们生活的各个方面,例如,通过网络进行打车、购物、订外卖等,但是,目前网络上的信息呈爆炸性增长,信息更新的频率也越来越快,这就使得网络上存在各式各样的信息,当用户通过网络购买服务时,需要浏览大量的信息才能找到想要的服务,这无疑会降低用户体验。因此,对于服务提供商而言,如何在不给用户带来负担的前提下为用户提供更适合的服务,是一个亟待解决的问题。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种信息识别方法、装置、电子设备及存储介质,能够在用户无感知的情况下提供更适合的服务,提升用户体验。第一方面,本申请实施例提供了一种信息识别方法,所述方法包括:获取待识别音频;确定表征所述待识别音频的声学特征的特征向量;基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签;依据所述服务标签确定出与所述服务标签相匹配的服务信息。一种可选实施方式中,所述服务标签包括年龄识别结果;所述基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签的步骤,包括:将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设年龄区间的概率值;依据所述特征向量在各个预设年龄区间的概率值,确定出所述待识别音频对应的年龄识别结果。一种可选实施方式中,所述信息识别模型包括第一网络及第二网络;所述将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设年龄区间的概率值的步骤,包括:将所述特征向量输入所述信息识别模型,利用所述第一网络对所述特征向量进行特征提取,得到第一特征图;将从所述第一网络提取到的第一特征图输入所述第二网络并进行分类,得到所述特征向量在各个预设年龄区间的概率值。一种可选实施方式中,所述第一网络包括卷积层及统计池化层;所述将所述特征向量输入所述信息识别模型,利用所述第一网络对所述特征向量进行特征提取,得到第一特征图的步骤,包括:将所述特征向量输入所述信息识别模型,利用所述卷积层的卷积核和卷积核偏置对所述特征向量进行卷积处理,得到第一输出特征图;利用所述统计池化层对所述第一输出特征图进行统计池化处理,得到第一特征图。一种可选实施方式中,所述第二网络包括全连接层及多类逻辑回归层;所述将从所述第一网络提取到的第一特征图输入所述第二网络并进行分类,得到所述特征向量在各个预设年龄区间的概率值的步骤,包括:将从所述第一网络提取到的第一特征图输入所述全连接层,利用所述全连接层对第一特征图进行降维,得到第一向量;将所述第一向量输入所述多类逻辑回归层,得到所述特征向量在各个预设年龄区间的概率值。一种可选实施方式中,所述依据所述特征向量在各个预设年龄区间的概率值,确定出所述待识别音频对应的年龄识别结果的步骤,包括:将所述特征向量在各个预设年龄区间的概率值进行加权平均,得到所述待识别音频对应的年龄识别结果。一种可选实施方式中,服务器预先存储有多个预设年龄区间及每个预设年龄区间对应的服务内容;所述依据所述服务标签确定出与所述服务标签相匹配的服务信息的步骤,包括:依据所述年龄识别结果,从所述多个预设年龄区间中确定出所述年龄识别结果所属的目标年龄区间;获取所述目标年龄区间对应的服务内容,得到与所述服务标签相匹配的服务信息。一种可选实施方式中,所述服务标签包括性别识别结果;所述基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签的步骤,包括:将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设性别类别的概率值;利用预先训练的隐马尔科夫模型对所述特征向量在各个预设性别类别的概率值进行约束,得到所述待识别音频对应的性别识别结果。一种可选实施方式中,所述信息识别模型包括第三网络及第四网络;所述将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设性别类别的概率值的步骤,包括:将所述特征向量输入所述信息识别模型,利用所述第三网络对所述特征向量进行特征提取,得到第二特征图;利用所述第四网络对所述第三网络输出的第二特征图进行分类,得到所述特征向量在各个预设性别类别的概率值。一种可选实施方式中,所述第三网络包括卷积层及长短时记忆层;所述将所述特征向量输入所述信息识别模型,利用所述第三网络对所述特征向量进行特征提取,得到第二特征图的步骤,包括:将所述特征向量输入所述信息识别模型,利用所述卷积层的卷积核和卷积核偏置对所述特征向量进行卷积处理,得到第二输出特征图;利用所述长短时记忆层捕捉所述第二输出特征图的序列信息,得到第二特征图。一种可选实施方式中,所述第四网络包括全连接层及多类逻辑回归层;所述利用所述第四网络对所述第三网络输出的第二特征图进行分类,得到所述特征向量在各个预设性别类别的概率值的步骤,包括:将所述第三网络输出的第二特征图输入所述全连接层,利用所述全连接层对第二特征图进行降维,得到第二向量;利用所述多类逻辑回归层对所述第二向量进行处理,得到所述特征向量在各个预设性别类别的概率值。一种可选实施方式中,服务器预先存储有多个预设性别类别及每个预设性别类别对应的服务内容;所述依据所述服务标签确定出与所述服务标签相匹配的服务信息的步骤,包括:依据所述性别识别结果,从所述多个服务内容中获取所述性别识别结果对应的目标服务内容,得到与所述服务标签相匹配的服务信息。一种可选实施方式中,所述服务标签包括身份验证结果;所述基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签的步骤,包括:获取所述待识别音频对应的标准音频;确定表征所述标准音频的声学特征的特征向量;将所述待识别音频对应的特征向量和所述标准音频对应的特征向量均输入所述信息识别模型,得到所述待识别音频和所述标准音频的相似度分值;根据所述相似度分值确定出所述待识别音频对应的身份验证结果,所述身份验证结果包括验证通过结果或验证失败结果。一种可选实施方式中,服务器预先存储有身份验证结果及所述身份验证结果对应的服务内容;所述依据所述服务标签确定出与所述服务标签相匹配的服务信息的步骤,包括:当所述身份验证结果为验证通过结果时,获取所述验证通过结果对应的服务内容作为与所述服务标签相匹配的服务信息;当所述身份验证结果为验证失败结果时,获取所述验证失败结果对应的服务内容作为与所述服务标签相匹配的服务信息。第二方面,本申请实施例还提供了一种信息识别装置,所述装置包括:音频获取模块,用于获取待识别音频;第一执行模块,用于确定表征所述待识别音频的声学特征的特征向量;第二执行模块,用于基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签;第三执行模块,用于依据所述服务标签确定出与所述服务标签相匹配的服务信息。第三方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子本文档来自技高网...

【技术保护点】
1.一种信息识别方法,其特征在于,所述方法包括:/n获取待识别音频;/n确定表征所述待识别音频的声学特征的特征向量;/n基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签;/n依据所述服务标签确定出与所述服务标签相匹配的服务信息。/n

【技术特征摘要】
1.一种信息识别方法,其特征在于,所述方法包括:
获取待识别音频;
确定表征所述待识别音频的声学特征的特征向量;
基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签;
依据所述服务标签确定出与所述服务标签相匹配的服务信息。


2.根据权利要求1所述的方法,其特征在于,所述服务标签包括年龄识别结果;
所述基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签的步骤,包括:
将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设年龄区间的概率值;
依据所述特征向量在各个预设年龄区间的概率值,确定出所述待识别音频对应的年龄识别结果。


3.根据权利要求2所述的方法,其特征在于,所述信息识别模型包括第一网络及第二网络;
所述将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设年龄区间的概率值的步骤,包括:
将所述特征向量输入所述信息识别模型,利用所述第一网络对所述特征向量进行特征提取,得到第一特征图;
将从所述第一网络提取到的第一特征图输入所述第二网络并进行分类,得到所述特征向量在各个预设年龄区间的概率值。


4.根据权利要求3所述的方法,其特征在于,所述第一网络包括卷积层及统计池化层;
所述将所述特征向量输入所述信息识别模型,利用所述第一网络对所述特征向量进行特征提取,得到第一特征图的步骤,包括:
将所述特征向量输入所述信息识别模型,利用所述卷积层的卷积核和卷积核偏置对所述特征向量进行卷积处理,得到第一输出特征图;
利用所述统计池化层对所述第一输出特征图进行统计池化处理,得到第一特征图。


5.根据权利要求3所述的方法,其特征在于,所述第二网络包括全连接层及多类逻辑回归层;
所述将从所述第一网络提取到的第一特征图输入所述第二网络并进行分类,得到所述特征向量在各个预设年龄区间的概率值的步骤,包括:
将从所述第一网络提取到的第一特征图输入所述全连接层,利用所述全连接层对第一特征图进行降维,得到第一向量;
将所述第一向量输入所述多类逻辑回归层,得到所述特征向量在各个预设年龄区间的概率值。


6.根据权利要求2所述的方法,其特征在于,所述依据所述特征向量在各个预设年龄区间的概率值,确定出所述待识别音频对应的年龄识别结果的步骤,包括:
将所述特征向量在各个预设年龄区间的概率值进行加权平均,得到所述待识别音频对应的年龄识别结果。


7.根据权利要求2所述的方法,其特征在于,服务器预先存储有多个预设年龄区间及每个预设年龄区间对应的服务内容;
所述依据所述服务标签确定出与所述服务标签相匹配的服务信息的步骤,包括:
依据所述年龄识别结果,从所述多个预设年龄区间中确定出所述年龄识别结果所属的目标年龄区间;
获取所述目标年龄区间对应的服务内容,得到与所述服务标签相匹配的服务信息。


8.根据权利要求1所述的方法,其特征在于,所述服务标签包括性别识别结果;
所述基于所述特征向量以及预先训练的信息识别模型,得到所述待识别音频对应的服务标签的步骤,包括:
将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设性别类别的概率值;
利用预先训练的隐马尔科夫模型对所述特征向量在各个预设性别类别的概率值进行约束,得到所述待识别音频对应的性别识别结果。


9.根据权利要求8所述的方法,其特征在于,所述信息识别模型包括第三网络及第四网络;
所述将所述特征向量输入所述信息识别模型,得到所述特征向量在各个预设性别类别的概率值的步骤,包括:
将...

【专利技术属性】
技术研发人员:张译杰彭一平杨阳扶元地宋玉洲
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1