一种语音信息处理方法、装置及终端制造方法及图纸

技术编号:23164789 阅读:75 留言:0更新日期:2020-01-21 22:36
本申请实施例提供一种语音信息处理方法、装置及终端,涉及计算机技术领域,可以提高终端执行语义理解结果对应的事件的效率,并节省进行语义理解消耗的网络流量。具体方案包括:终端接收语音信息,将该语音信息转换为文本信息;获取文本信息归属于预设M个事件领域中的每个事件领域的领域概率;获取文本信息归属于N个事件领域中的每个事件领域的先验概率,N≤M;获取文本信息归属于N个事件领域中的每个事件领域的置信度;根据文本信息归属于N个事件领域中的每个事件领域的领域概率、先验概率和置信度,计算文本信息分别归属于N个事件领域的N个概率值;输出根据N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果。

A voice information processing method, device and terminal

【技术实现步骤摘要】
【国外来华专利技术】一种语音信息处理方法、装置及终端本申请要求于2017年10月09日提交中国专利局、申请号为201710931504.9、申请名称为“一种语音信息处理方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请实施例涉及计算机
,尤其涉及一种语音信息处理方法、装置及终端。
技术介绍
随着电子技术的发展,智能终端的功能越来越多,如终端可以为用户提供语音对话功能,即终端可以接收用户输入的语音信息(如“打开地图应用”),对该语音信息进行语义理解,然后执行语义理解结果对应的事件(开启终端中的地图应用,如百度地图)。一般而言,由于终端的处理能力有限,终端可以将接收的语音信息发送至云端服务器,由云端服务器对该语音信息进行语义理解,得到语义理解结果;然后,云端服务器可以指示终端执行语义理解结果对应的事件。但是,在上述语音识别的过程中,需要终端与云端服务器进行至少两次数据交互,而终端与云端服务器的数据交互可能会因为网络故障等原因,造成终端不能及时执行语义理解结果对应的事件。并且,由于语音信息的数据量一般较大,因此会消耗大量的网络流量。
技术实现思路
本申请实施例提供一种语音信息处理方法、装置及终端,可以节省由云端服务器进行语义理解时消耗的网络流量。第一方面,本申请实施例提供一种语音信息处理方法,该语音信息处理方法包括:终端接收语音信息,将该语音信息转换为文本信息;该终端中预设M个事件领域;获取上述文本信息归属于M个事件领域中的每个事件领域的领域概率,上述文本信息归属于一个事件领域的领域概率用于表征该文本信息归属于该事件领域的可能性;获取上述文本信息归属于N个事件领域中的每一个事件领域的先验概率,上述文本信息归属于一个事件领域的先验概率用于表征根据已进行的多次语义理解,确定该文本信息归属于该事件领域的概率,上述N个事件领域为上述M个事件领域中的N个事件领域,N小于或等于M;获取上述文本信息归属于上述N个事件领域中的每个事件领域的置信度,上述文本信息归属于一个事件领域的置信度用于表征上述文本信息归属于该事件领域的确信程度;根据上述文本信息归属于上述N个事件领域中的每个事件领域的领域概率、先验概率和置信度,计算上述文本信息分别归属于所述N个事件领域的N个概率值;输出根据上述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果。可选的,所述输出根据上述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果,可以被替换为:将根据上述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果作为最终的语义理解结果。其中,文本信息归属于一个事件领域的先验概率:用于表征历史数据中,文本信息归属于该事件领域的概率;文本信息归属于一个事件领域的领域概率:用于表征该文本信息归属于该事件领域的可能性;文本信息归属于一个事件领域的置信度:用于表征该文本信息归属于该事件领域的确信程度。本申请实施例在选择处理文本信息的事件领域时,不仅参考了对文本信息中包括的词汇进行分析得到的领域概率,还参考了文本信息归属于事件领域的先验概率,以及用于表征该文本信息归属于该事件领域的确信程度的置信度;因此,可以提高选择的事件领域的准确性,进而可以提高语义理解结果的准确性,从而可以提高终端执行事件与用户输入的语音信息指示终端执行的事件的符合度,可以提高用户体验。在一种可能的设计方法中,当N小于M时,上述N个事件领域是上述预设M个事件领域中,领域概率按照由高至低的顺序排列在前N位的N个事件领域,N≥2。具体的,终端可以按照领域概率由高至低的顺序,从上述M个事件领域中选择出领域概率排列在前N位的事件领域。可以理解,终端从M个事件领域中选择出N个事件领域后,只需要计算上述文本信息归属于上述N个事件领域的先验概率和置信度,而不需要计算文本信息归属于M个事件领域中所有事件领域的先验概率和置信度,可以减少终端进行语音信息处理时的计算量,提高计算效率。在另一种可能的设计方法中,在上述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率之后,本申请实施例的方法还包括:终端在上述N个事件领域,分别对上述文本信息进行语义理解,得到N个语义理解结果。其中,终端在对文本信息进行领域识别后,可以将文本信息传输至识别到的事件领域的对话引擎,由对话引擎对该文本信息进行语义理解,得到语义理解结果。或者,本实施例可以不限定终端进行领域识别和语义理解的顺序,可以同时或基本同时进行领域识别和语义理解,也可以先进行语义理解后进行领域识别。在另一种可能的设计方法中,上述M个事件领域中的每个事件领域对应于一个关键字模型,该关键字模型中包括:对应事件领域的多个关键字。具体的,上述终端获取上述文本信息归属于上述N个事件领域中的每个事件领域的置信度,可以包括:终端对所述文本信息进行分词处理,并提取至少一个分词;获取该至少一个分词对应的关键字在上述每个事件领域的关键字模型中的分布信息;根据该分布信息,计算上述文本信息归属于上述N个事件领域中的每个事件领域的置信度。在另一种可能的设计方法中,上述终端获取上述文本信息归属于M个事件领域中的每个事件领域的领域概率,包括:终端对上述文本信息进行分词处理,并提取至少一个分词;从上述每个事件领域对应的数据库模型中查找上述至少一个分词对应的特征,上述数据库模型中包括多个特征、每个特征的权重及每个特征对应的分词,上述权重用于指示上述权重对应的特征归属于上述数据库模型中对应的事件领域的概率;其中,每个事件领域对应一个数据库模型;根据从上述每个事件领域对应的数据库模型中查找到的特征的权重,计算上述文本信息归属于上述每个事件领域的领域概率。其中,在上述特征数据库中,同一分词在不同事件领域的数据库模型中的特征相同,即在特征数据库中,分词的特征可以唯一标识该分词。但是,同一分词在不同事件领域中的权重不同。在另一种可能的设计方法中,上述M个事件领域中的每个事件领域对应于一个关键字模型,上述关键字模型中包括:多个关键字和每个关键字指示文本信息归属于上述关键字模型对应的事件领域的概率。上述终端获取上述文本信息归属于M个事件领域中的每个事件领域的领域概率,包括:从上述文本信息中识别至少一个关键字;从上述每个事件领域对应的关键字模型中获取上述至少一个关键字分别指示的概率;根据上述至少一个关键字分别指示的概率,计算上述文本信息归属于上述每个事件领域的领域概率。其中,由于至少一个关键字中可能包括各个事件领域的关键字模型中的关键字,而每个关键字在不同的事件领域的关键字模型中,可以指示上述文本信息归属于对应事件领域的概率;因此,根据文本信息中包括的各个事件领域的关键字所指示的概率,可以计算得到文本信息归属于各个事件领域的领域概率。在另一种可能的设计方法中,本申请实施例的方法还可以包括:上述终端输出上诉后语义理解结果之后,根据上述语义理解结果,执行语义理解结果对应的操作。第二方面,本申请实施例提本文档来自技高网...

【技术保护点】
一种语音信息处理方法,其特征在于,所述方法包括:/n终端接收语音信息,将所述语音信息转换为文本信息;所述终端中预设M个事件领域;/n所述终端获取所述文本信息归属于所述M个事件领域中的每个事件领域的领域概率,所述领域概率用于表征所述文本信息归属于一个事件领域的可能性;/n所述终端获取所述文本信息归属于N个事件领域中的每一个事件领域的先验概率,所述先验概率用于表征根据已进行的多次语义理解,确定所述文本信息归属于一个事件领域的概率,所述N个事件领域为所述M个事件领域中的N个事件领域,N小于或等于M;/n所述终端获取所述文本信息归属于所述N个事件领域中的每个事件领域的置信度,所述置信度用于表征所述文本信息归属于一个事件领域的确信程度;/n所述终端根据所述文本信息归属于所述N个事件领域中的每个事件领域的领域概率、先验概率和置信度,计算所述文本信息分别归属于所述N个事件领域的N个概率值;/n所述终端输出根据所述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果。/n

【技术特征摘要】
【国外来华专利技术】20171009 CN 2017109315049一种语音信息处理方法,其特征在于,所述方法包括:
终端接收语音信息,将所述语音信息转换为文本信息;所述终端中预设M个事件领域;
所述终端获取所述文本信息归属于所述M个事件领域中的每个事件领域的领域概率,所述领域概率用于表征所述文本信息归属于一个事件领域的可能性;
所述终端获取所述文本信息归属于N个事件领域中的每一个事件领域的先验概率,所述先验概率用于表征根据已进行的多次语义理解,确定所述文本信息归属于一个事件领域的概率,所述N个事件领域为所述M个事件领域中的N个事件领域,N小于或等于M;
所述终端获取所述文本信息归属于所述N个事件领域中的每个事件领域的置信度,所述置信度用于表征所述文本信息归属于一个事件领域的确信程度;
所述终端根据所述文本信息归属于所述N个事件领域中的每个事件领域的领域概率、先验概率和置信度,计算所述文本信息分别归属于所述N个事件领域的N个概率值;
所述终端输出根据所述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果。


根据权利要求1所述的方法,其特征在于,当N小于M时,所述N个事件领域是所述预设M个事件领域中,领域概率按照由高至低的顺序排列在前N位的N个事件领域,N≥2。


根据权利要求1或2所述的方法,其特征在于,在所述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率之后,所述方法还包括:
所述终端在所述N个事件领域,分别对所述文本信息进行语义理解,得到N个语义理解结果。


根据权利要求1-3中任一项所述的方法,其特征在于,所述M个事件领域中的每个事件领域对应于一个关键字模型,所述关键字模型中包括:对应事件领域的多个关键字;
所述终端获取所述文本信息归属于所述N个事件领域中的每个事件领域的置信度,包括:
所述终端对所述文本信息进行分词处理,并提取至少一个分词;
所述终端获取所述至少一个分词对应的关键字在所述每个事件领域的关键字模型中的分布信息;
所述终端根据所述分布信息,计算所述文本信息归属于所述N个事件领域中的每个事件领域的置信度。


根据权利要求1-4中任一项所述的方法,其特征在于,所述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率,包括:
所述终端对所述文本信息进行分词处理,并提取至少一个分词;
所述终端从所述每个事件领域对应的数据库模型中查找所述至少一个分词对应的特征,所述数据库模型中包括多个特征、每个特征的权重及每个特征对应的分词,所

述权重用于指示所述权重对应的特征归属于所述数据库模型中对应的事件领域的概率;其中,每个事件领域对应一个数据库模型;
所述终端根据从所述每个事件领域对应的数据库模型中查找到的特征的权重,计算所述文本信息归属于所述每个事件领域的领域概率。


根据权利要求1-4中任一项所述的方法,其特征在于,所述M个事件领域中的每个事件领域对应于一个关键字模型,所述关键字模型中包括:多个关键字和每个关键字指示文本信息归属于所述关键字模型对应的事件领域的概率;
所述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率,包括:
所述终端从所述文本信息中识别至少一个关键字;
所述终端从所述每个事件领域对应的关键字模型中获取所述至少一个关键字分别指示的概率;
所述终端根据所述至少一个关键字分别指示的概率,计算所述文本信息归属于所述每个事件领域的领域概率。


根据权利要求1-6中任一项所述的方法,其特征在于,还包括:
所述终端输出所述语义理解结果之后,所述终端根据所述语义理解结果,执行所述语义理解结果对应的操作。


一种语音信息处理装置,其特征在于,所述装置包括:
接收单元,用于接收语音信息;
转换单元,用于将所述接收单元接收的所述语音信息转换为文本信息;所述终端中预设M个事件领域;
第一获取单元,用于获取所述转换单元转换得到的所述文本信息归属于所述M个事件领域中的每个事件领域的领域概率,所述领域概率用于表征所述文本信息归属于一个事件领域的可能性;
第二获取单元,用于获取所述转换单元...

【专利技术属性】
技术研发人员:隋志成李艳明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1