一种语音处理方法、装置、设备及介质制造方法及图纸

技术编号:36948896 阅读:70 留言:0更新日期:2023-03-22 19:09
本公开涉及一种语音处理方法、装置、设备及介质,尤其涉及自然语言处理技术领域;其中,该方法包括:确定语音数据对应的语义领域列表,语义领域列表中包括至少两个语义领域和每个语义领域对应的定位分值;确定语义领域列表中预设个数的定位分值不相同,获取相邻定位分值之间的差值;当差值小于预设阈值时,确定与每个语义领域相关的分词对应的分词属性总分值;基于定位分值和分词属性总分值,确定语音数据对应的目标语义领域。本公开实施例通过上述过程能够确定语音数据对应的目标语义领域,提高语音处理过程的准确性,解决语义理解中由于一词多义导致的误定位问题,提升定位的准确率。率。率。

【技术实现步骤摘要】
一种语音处理方法、装置、设备及介质


[0001]本公开涉及自然语言处理
,尤其涉及一种语音处理方法、装置、设备及介质。

技术介绍

[0002]随着语音助手的功能不断丰富,语义词典中属性类型的扩张,一词多义现象日益增长。当语音助手接入业务较多时,同一说法可能对应不同的业务和不同的领域,在领域确定错误的情况下,智能设备所执行的操作也是错误的。因此,如何在语音处理过程中从多个语义领域确定最终的语义领域,变得尤为重要。

技术实现思路

[0003]为了解决上述技术或者至少部分地解决上述技术问题,本公开提供了一种语音处理方法、装置、设备及介质,能够确定语音数据对应的目标语义领域,提高语音处理过程的准确性,解决语义理解中由于一词多义导致的误定位问题,提升定位的准确率。
[0004]为了实现上述目的,本公开实施例提供的技术方案如下:
[0005]第一方面,本公开提供了一种语音处理方法,该方法包括:
[0006]确定语音数据对应的语义领域列表,所述语义领域列表中包括至少两个语义领域和每个语义领域对应的定位分值;...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:确定语音数据对应的语义领域列表,所述语义领域列表中包括至少两个语义领域和每个语义领域对应的定位分值;确定所述语义领域列表中预设个数的定位分值不相同,获取相邻定位分值之间的差值;当所述差值小于预设阈值时,确定与每个语义领域相关的分词对应的分词属性总分值;基于所述定位分值和所述分词属性总分值,确定所述语音数据对应的目标语义领域。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述差值大于或等于所述预设阈值时,比较各定位分值的大小,并将所述定位分值中最大定位分值对应的语义领域确定为所述目标语义领域。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述语义领域列表中预设个数的定位分值相同,获取所述分词属性总分值;比较各分词属性总分值的大小,将所述分词属性总分值中最大分词属性总分值对应的语义领域确定为所述目标语义领域。4.根据权利要求1所述的方法,其特征在于,所述确定与每个语义领域相关的分词对应的分词属性总分值,包括:针对所述分词中每个分词对应的各属性类型,确定每个属性类型在所有属性类型中的第一比例;根据不同语义领域的训练语料,确定每个分词在所述训练语料的不同属性类型下的出现次数;基于所述出现次数和属性类型的强弱关系,确定每个属性类型在所有属性类型中的第二比例;基于所述第一比例和所述第二比例,确定每个属性类型对应的目标比例;基于所述目标比例,确定与每个语义领域相关的分词对应的所述分词属性总分值。5.根据权利要求4所述的方法,其特征在于,所述基于所述出现次数和属性类型的强弱关系,确定每个属性类型在所有属性类型中的第二比例,包括:当所有属性类型均为强属性类型时,基于各出现次数的位数,确定各影响因素对应的数值;基于所述数值,构建判断矩阵;对所述判断矩阵进行向量标准化,得到每个属性类型在所有属性类型中...

【专利技术属性】
技术研发人员:马宏王娜李霞田露华
申请(专利权)人:海信视像科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1