资源名权重确定方法、语音信息处理方法以及装置制造方法及图纸

技术编号:36341044 阅读:47 留言:0更新日期:2023-01-14 17:54
本申请提供了一种资源名权重确定方法、语音信息处理方法以及装置,权重确定方法包括获取需要进行权重计算的资源名,确定资源名在预先建立的语料库中的重要度,将重要度输入到预先建立的权重公式,输出资源名权重,其中权重公式为单调递减函数,权重公式的变化率随重要度的增大而变小。该资源名权重确定方法,根据资源名在语料库的重要度来确定其权重,能快速且准确计算出各资源名的权重;构建语音助手的规则引擎时充分考虑资源名的权重,可以使规则引擎不容易受到资源名语义信息丰富性的干扰,从而避免规则引擎的错配,从而进一步保证语音助手执行正确的技能。助手执行正确的技能。助手执行正确的技能。

【技术实现步骤摘要】
资源名权重确定方法、语音信息处理方法以及装置


[0001]本申请涉及数据处理
,具体涉及一种资源名权重确定方法、语音信息处理方法以及装置。

技术介绍

[0002]随着语音识别技术的发展,越来越多的智能设备(例如智能手机、智能耳机)等安装有语音助手。语音助手可以与智能设备的用户进行语音交互,以识别出用户的意图,从而帮助用户解决一些实际的问题或代替用户对智能设备进行操作。例如,用户可以通过语音助手发出“打开地图或音乐”的命令,智能设备可以识别出用户需要打开地图或播放音乐的意图后,就可以触发智能设备中地图或音乐播放程序启动。
[0003]语音助手的应用场景非常广泛,例如启动智能设备中应用程序、搜索问题答案等。为了使其适用不同的应用场景,其需要具备不同的技能。目前,通常会使用规则引擎的方式来构建语音助手的不同技能,常用的规则引擎的方式为:某技能通用句式+部分关键词+实体对象。而实体对象通常是互联网上各种资源名(如音乐、小说、书名等)。由于资源名存在非常宽泛的自由度,容易影响规则引擎中的“通用句式”和/或“部分关键词”,甚至是影响到其他实体对象。比如:演员,即是职业或角色,也是歌名;别,是一首歌,同样也是关键词。
[0004]基于此,在构建语音助手的规则引擎时容易受到资源名语义信息丰富性的干扰,会导致规则引擎的错配,从而最终导致语音助手执行错误的技能。

技术实现思路

[0005]有鉴于此,本申请实施例中提供了一种资源名权重确定方法、语音信息处理方法以及装置,以克服现有技术构建语音助手的规则引擎时容易受到资源名语义信息丰富性的干扰,会导致规则引擎的错配,从而最终导致语音助手执行错误的技能的问题。
[0006]第一方面,本申请实施例提供了一种资源名权重确定方法,该方法包括:
[0007]获取需要进行权重计算的资源名;
[0008]确定所述资源名在预先建立的语料库中的重要度;
[0009]将所述重要度输入至预先建立的权重公式,以输出所述资源名的权重;
[0010]其中,权重公式为单调递减函数,所述权重公式的变化率随所述重要度的增大而变小。
[0011]第二方面,本申请实施例提供了一种语音信息处理方法,该方法包括:
[0012]在语音启动后,接收语音信息;
[0013]当识别出语音信息中包含有资源名时,获取所述资源名的权重;其中所述资源名的权重采用上述第一方面所述的方法来计算;
[0014]当所述资源名的权重大于或等于第二预设阈值时,执行第一预设操作;
[0015]当所述资源名的权重小于第二预设阈值时,执行第二预设操作。
[0016]第三方面,本申请实施例提供了一种资源名权重确定装置,该装置包括:
[0017]资源名获取模块,用于获取需要进行权重计算的资源名;
[0018]重要度确定模块,用于确定所述资源名在预先建立的语料库中的重要度;
[0019]权重输出模块,用于将所述重要度输入至预先建立的权重公式,以输出所述资源名的权重;
[0020]其中,权重公式为单调递减函数,所述权重公式的变化率随所述重要度的增大而变小。
[0021]第四方面,本申请实施例提供了一种语音信息处理装置,该装置包括:
[0022]语音信息接收模块,用于在语音助手启动后,接收语音信息;
[0023]权重获取模块,用于当识别出语音信息中包含有资源名时,获取所述资源名的权重;其中所述资源名的权重采用上述第一方面所述的方法来计算;
[0024]第一执行模块,用于当所述资源名的权重大于或等于第二预设阈值时,执行第一预设操作;
[0025]第二执行模块,用于当所述资源名的权重小于第二预设阈值时,执行第二预设操作。
[0026]第五方面,本申请实施例提供了一种终端设备,包括:存储器;一个或多个处理器,与所述存储器耦接;一个或多个应用程序,其中,一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于执行上述第一方面提供的资源名权重确定方法,和/或上述第二方面提供的语音信息处理方法。
[0027]第六方面,本申请实施例提供了一种计算机可读取存储介质,计算机可读取存储介质中存储有程序代码,程序代码可被处理器调用执行上述第一方面提供的资源名权重确定方法,和/或上述第二方面提供的语音信息处理方法。
[0028]本申请实施例提供的资源名权重确定方法、装置、终端设备和计算机可读存储介质,首先获取需要进行权重计算的资源名,然后确定资源名在预先建立的语料库中的重要度,再将重要度输入到预先建立的权重公式,输出资源名权重,其中权重公式为单调递减函数,权重公式的变化率随重要度的增大而变小。
[0029]其中,资源名的重要度可以表示资源名在预先建立的语料库中的重要程度。当资源名在语料库中重要度越高,说明该资源名在语料库中出现的次数、频率等越高或使用的场景越多样,进而说明该资源名是一个常用词或通用词,其包含的语义信息也就越丰富多样(即一个资源名存在多种含义),当其在语音信息/文本信息中被匹配上时,更容易对语音助手执行具体任务产生干扰,因此对常用词或通用词的资源名的赋予更小权重;而当资源名在语料库中重要度越低时,说明该资源名在语料库中出现的次数、频率等越低,或其使用的场景越单一,进而说明该资源名是一个特定词,其包含的语音信息也就越单一且固定,当其在语音信息/文本信息中被匹配上时,更不容易对语音助手执行具体任务产生干扰,那么对特定词的资源名赋予更大的权重。
[0030]权重公式是一种权重映射函数,其具有单调递减,以及当资源名的重要度较小时其变化率较大,当资源名的重要度较大时其变化率较小的特性;采用该公式可以根据资源名的重要度准确且有效地计算出资源名的权重。
[0031]该资源名权重确定方法,根据资源名在语料库的重要度来确定其权重,能快速且准确计算出各资源名的权重;构建语音助手的规则引擎时充分考虑资源名的权重,可以使
规则引擎不容易受到资源名语义信息丰富性的干扰,从而避免规则引擎的错配,从而进一步保证语音助手执行正确的技能。
[0032]本申请实施例提供的语音信息处理方法、装置、终端设备和计算机可读存储介质,由于采用了本申请实施例提供的资源名权重确定方法,使得计算出来的资源名的权重非常的准确,然后根据不同的权重来构建不同规则引擎从而来执行不同的操作。该语音信息处理方法在使用语音助手执行不同技能时避免其引擎规则受资源名语义信息丰富性的干扰,从而避免规则引擎的错配以及保证语音助手执行正确的技能。
附图说明
[0033]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0034]图1为本申请实施例提供的资源名权重确定方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种资源名权重确定方法,其特征在于,所述方法包括:获取需要进行权重计算的资源名;确定所述资源名在预先建立的语料库中的重要度;将所述重要度输入至预先建立的权重公式,以输出所述资源名的权重;其中,权重公式为单调递减函数,所述权重公式的变化率随所述重要度的增大而变小。2.根据权利要求1所述的方法,其特征在于,所述重要度包括词频,所述确定所述资源名在预先建立的语料库中的重要度,包括:统计所述资源名在所述语料库的每篇文档中出现的次数;根据每篇文档中出现的次数计算出所述资源名在所述语料库中出现的总次数,以得到所述资源名在所述语料库中的词频。3.根据权利要求1所述的方法,其特征在于,所述重要度包括词频逆文档频率值,所述确定所述资源名在预先建立的语料库中的重要度,包括:统计所述资源名在所述语料库的每篇文档中出现的次数、文档总数量以及包含所述资源名的文档数量;根据每篇文档中出现的次数计算出所述资源名在所述语料库中出现的总次数,以得到所述资源名在所述语料库中的词频;对所述词频进行标注化处理,得到标准词频;根据包含所述资源名的文档数量和所述文档总数量,计算逆文档频率;根据所述标准词频和所述逆文档频率计算所述资源名在预先建立的语料库中的词频逆文档频率值。4.根据权利要求1所述的方法,其特征在于,所述语料库通过以下方式建立:爬取多个文档,对各所述文档按领域进行分类;采用分层抽样方法从每一类别的文档中提取相应数量的文档,以形成所述语料库。5.根据权利要求4所述的方法,其特征在于,所述从每一类别的文档中提取相应数量的文档,以形成所述语料库,包括:对每一类别的文档的对应设置抽样数量、最大抽样限值和最小抽样限值;按照所述抽样数量从每一类别的文档中随机抽取相应数量的文档,以形成所述语料库;或:从每一类别的文档中随机抽取小于或等于所述最大抽样限值数量的文档,以形成所述语料库;或:从每一类别的文档中随机抽取大于或等于所述最小抽样限值数量的文档,以形成所述语料库。6.根据权利要求1

5任一项所述的方法,其特征在于,所述将所述重要度输入至预先建立的权重公式,以输出所述资源名的权重,包括:将所述重要度输入至预先建立的权重公式,输出所述资源名的初始权重;根据所述资源名的词性来对所述初始权重进行调整,以得到所述资源名的权重。7.根据权利要求6所述的方法,其特征在于,根据所述资源名的词性来对所述初始权重
进行...

【专利技术属性】
技术研发人员:冯霁肖湘汝张博
申请(专利权)人:广东粤港澳大湾区国家纳米科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1