【技术实现步骤摘要】
【国外来华专利技术】一种语音信息处理方法、装置及终端本申请要求于2017年10月09日提交中国专利局、申请号为201710931504.9、申请名称为“一种语音信息处理方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请实施例涉及计算机
,尤其涉及一种语音信息处理方法、装置及终端。
技术介绍
随着电子技术的发展,智能终端的功能越来越多,如终端可以为用户提供语音对话功能,即终端可以接收用户输入的语音信息(如“打开地图应用”),对该语音信息进行语义理解,然后执行语义理解结果对应的事件(开启终端中的地图应用,如百度地图)。一般而言,由于终端的处理能力有限,终端可以将接收的语音信息发送至云端服务器,由云端服务器对该语音信息进行语义理解,得到语义理解结果;然后,云端服务器可以指示终端执行语义理解结果对应的事件。但是,在上述语音识别的过程中,需要终端与云端服务器进行至少两次数据交互,而终端与云端服务器的数据交互可能会因为网络故障等原因,造成终端不能及时执行语义理解结果对应的事件。并且,由于语音信息的数据量一般较大,因此会消耗大量的网络流量。
技术实现思路
本申请实施例提供一种语音信息处理方法、装置及终端,可以节省由云端服务器进行语义理解时消耗的网络流量。第一方面,本申请实施例提供一种语音信息处理方法,该语音信息处理方法包括:终端接收语音信息,将该语音信息转换为文本信息;该终端中预设M个事件领域;获取上述文本信息归属于M个事件领域中的每个事件领域的领域概率,上述文本信息归属于一个事件 ...
【技术保护点】
一种语音信息处理方法,其特征在于,所述方法包括:/n终端接收语音信息,将所述语音信息转换为文本信息;所述终端中预设M个事件领域;/n所述终端获取所述文本信息归属于所述M个事件领域中的每个事件领域的领域概率,所述领域概率用于表征所述文本信息归属于一个事件领域的可能性;/n所述终端获取所述文本信息归属于N个事件领域中的每一个事件领域的先验概率,所述先验概率用于表征根据已进行的多次语义理解,确定所述文本信息归属于一个事件领域的概率,所述N个事件领域为所述M个事件领域中的N个事件领域,N小于或等于M;/n所述终端获取所述文本信息归属于所述N个事件领域中的每个事件领域的置信度,所述置信度用于表征所述文本信息归属于一个事件领域的确信程度;/n所述终端根据所述文本信息归属于所述N个事件领域中的每个事件领域的领域概率、先验概率和置信度,计算所述文本信息分别归属于所述N个事件领域的N个概率值;/n所述终端输出根据所述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果。/n
【技术特征摘要】
【国外来华专利技术】20171009 CN 2017109315049一种语音信息处理方法,其特征在于,所述方法包括:
终端接收语音信息,将所述语音信息转换为文本信息;所述终端中预设M个事件领域;
所述终端获取所述文本信息归属于所述M个事件领域中的每个事件领域的领域概率,所述领域概率用于表征所述文本信息归属于一个事件领域的可能性;
所述终端获取所述文本信息归属于N个事件领域中的每一个事件领域的先验概率,所述先验概率用于表征根据已进行的多次语义理解,确定所述文本信息归属于一个事件领域的概率,所述N个事件领域为所述M个事件领域中的N个事件领域,N小于或等于M;
所述终端获取所述文本信息归属于所述N个事件领域中的每个事件领域的置信度,所述置信度用于表征所述文本信息归属于一个事件领域的确信程度;
所述终端根据所述文本信息归属于所述N个事件领域中的每个事件领域的领域概率、先验概率和置信度,计算所述文本信息分别归属于所述N个事件领域的N个概率值;
所述终端输出根据所述N个概率值中概率值最高的事件领域对文本信息进行语义理解的语义理解结果。
根据权利要求1所述的方法,其特征在于,当N小于M时,所述N个事件领域是所述预设M个事件领域中,领域概率按照由高至低的顺序排列在前N位的N个事件领域,N≥2。
根据权利要求1或2所述的方法,其特征在于,在所述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率之后,所述方法还包括:
所述终端在所述N个事件领域,分别对所述文本信息进行语义理解,得到N个语义理解结果。
根据权利要求1-3中任一项所述的方法,其特征在于,所述M个事件领域中的每个事件领域对应于一个关键字模型,所述关键字模型中包括:对应事件领域的多个关键字;
所述终端获取所述文本信息归属于所述N个事件领域中的每个事件领域的置信度,包括:
所述终端对所述文本信息进行分词处理,并提取至少一个分词;
所述终端获取所述至少一个分词对应的关键字在所述每个事件领域的关键字模型中的分布信息;
所述终端根据所述分布信息,计算所述文本信息归属于所述N个事件领域中的每个事件领域的置信度。
根据权利要求1-4中任一项所述的方法,其特征在于,所述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率,包括:
所述终端对所述文本信息进行分词处理,并提取至少一个分词;
所述终端从所述每个事件领域对应的数据库模型中查找所述至少一个分词对应的特征,所述数据库模型中包括多个特征、每个特征的权重及每个特征对应的分词,所
述权重用于指示所述权重对应的特征归属于所述数据库模型中对应的事件领域的概率;其中,每个事件领域对应一个数据库模型;
所述终端根据从所述每个事件领域对应的数据库模型中查找到的特征的权重,计算所述文本信息归属于所述每个事件领域的领域概率。
根据权利要求1-4中任一项所述的方法,其特征在于,所述M个事件领域中的每个事件领域对应于一个关键字模型,所述关键字模型中包括:多个关键字和每个关键字指示文本信息归属于所述关键字模型对应的事件领域的概率;
所述终端获取所述文本信息归属于M个事件领域中的每个事件领域的领域概率,包括:
所述终端从所述文本信息中识别至少一个关键字;
所述终端从所述每个事件领域对应的关键字模型中获取所述至少一个关键字分别指示的概率;
所述终端根据所述至少一个关键字分别指示的概率,计算所述文本信息归属于所述每个事件领域的领域概率。
根据权利要求1-6中任一项所述的方法,其特征在于,还包括:
所述终端输出所述语义理解结果之后,所述终端根据所述语义理解结果,执行所述语义理解结果对应的操作。
一种语音信息处理装置,其特征在于,所述装置包括:
接收单元,用于接收语音信息;
转换单元,用于将所述接收单元接收的所述语音信息转换为文本信息;所述终端中预设M个事件领域;
第一获取单元,用于获取所述转换单元转换得到的所述文本信息归属于所述M个事件领域中的每个事件领域的领域概率,所述领域概率用于表征所述文本信息归属于一个事件领域的可能性;
第二获取单元,用于获取所述转换单元...
【专利技术属性】
技术研发人员:隋志成,李艳明,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。