信息处理方法、装置及电子设备制造方法及图纸

技术编号:25990028 阅读:22 留言:0更新日期:2020-10-20 18:58
本发明专利技术实施例提供一种信息处理方法、装置及电子设备,获取输入智能设备的语音信息;对语音信息进行语音识别处理,得到语音信息对应的文本信息,文本信息包括至少一个词汇以及各词汇的时间信息;根据词汇的时间信息,对文本信息进行划分,得到至少一个文本片段;根据至少一个文本片段的语义识别结果,获取语音信息的有效语义信息;本实施例对语音信息不进行切分而直接识别为文本信息,在根据各词汇的时间信息对文本信息进行切分的过程考虑了自然语言理解,使得对文本信息的切分结果更加准确,进而根据切分后的文本片段的语义识别结果确定语音信息的有效语义信息,能够提高语义识别的准确率。

【技术实现步骤摘要】
信息处理方法、装置及电子设备
本专利技术实施例涉及人工智能
,尤其涉及一种信息处理方法、装置及电子设备。
技术介绍
随着人机交互技术的发展,语义识别技术显示出其重要性。语义识别是从人类发出的语音信号中提取特征信息并确定其语言含义的过程,主要包括语音识别过程和语义理解过程。语音识别过程是利用声学模型将人类的语音信号转换为文本的过程,语义理解过程是利用自然语言模型对文本的含义进行识别的过程。现有技术中,在对用户输入的语音信号进行处理时,首先利用语音活动性检测(voiceactivitydetection,VAD)技术,在连续的语音信号中确定出各个语音片段的起始点和终止点,实现对连续语音信号的切分,然后对切换后的语音片段进行语音识别和语义理解,以得到用户的语义。然而,在实际应用中,由于不同用户的说话语速、说话习惯以及说话人所处场景的不同,通过VAD检测的方式对语句进行切分,使得对语句的切分不够准确,进而导致语义识别的准确率不高。
技术实现思路
本专利技术实施例提供一种信息处理方法、装置及电子设备,用以提高语义识别的准确率。第一方面,本专利技术实施例提供一种信息处理方法,包括:获取输入智能设备的语音信息;对所述语音信息进行语音识别处理,得到所述语音信息对应的文本信息,所述文本信息包括至少一个词汇以及各所述词汇的时间信息,所述时间信息用于指示所述智能设备采集到所述词汇对应的语音帧的时间;根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段;根据所述至少一个文本片段的语义识别结果,获取所述语音信息的有效语义信息。可选的,所述根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段,包括:根据各所述词汇的时间信息,获取所述文本信息中相邻两个词汇之间的时间间隔;若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点;根据所确定的切分点,对所述文本信息进行切分,得到所述至少一个文本片段。可选的,所述若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点,包括:若所述时间间隔大于或等于目标阈值,则确定在所述两个词汇之间设置切分点。可选的,所述方法还包括:根据至少一个所述时间间隔,确定所述语音信息的语速等级;根据语速等级与时间阈值之间的对应关系,将与所述语音信息的语速等级对应的时间阈值作为所述目标阈值。可选的,所述方法还包括:根据所述文本信息的各所述时间间隔,获取所述时间间隔的第一平均值,并将所述第一平均值确定为所述目标阈值;或者,依次确定第一预设数量的词汇的时间间隔的第二平均值,并将所述第二平均值确定为所述第一预设数量的词汇之后的第二预设数量的词汇对应的目标阈值;或者,针对所述文本信息中的任意词汇,获取所述文本信息中位于所述词汇之前的所有词汇的时间间隔的第三平均值,将所述第三平均值作为所述词汇对应的目标阈值。可选的,所述语义识别结果包括:语义完整性概率得分和语义信息;所述根据所述至少一个文本片段的语义识别结果,获取所述语音信息的有效语义信息,包括:将语义完整性概率得分满足预设条件的文本片段的语义信息,作为所述语音信息的有效语义信息。可选的,所述将语义完整性概率得分满足预设条件的文本片段的语义信息,作为所述语音信息的有效语义信息,包括:针对所述至少一个文本片段中的每个文本片段,若所述文本片段的语义完整性概率得分大于或等于预设阈值,则将所述文本片段的语义信息作为所述语音信息的有效语义信息;或者,针对所述至少一个文本片段,将语义完整性概率得分最高的文本片段的语义信息作为所述语音信息的有效语义信息。可选的,所述将语义完整性概率得分满足预设条件的文本片段的语义信息,作为所述语音信息的有效语义信息,包括:针对所述至少一个文本片段中的任一文本片段,获取已缓存的历史文本片段,所述历史文本片段为所述文本片段之前的语义完整性概率得分不满足所述预设条件的至少一个文本片段;对所述历史文本片段和所述文本片段拼接得到的新的文本片段进行语义识别处理,获取所述新的文本片段的语义识别结果;若所述新的文本片段的语义完整性概率得分大于或等于预设阈值,则将所述新的文本片段的语义信息作为所述语音信息的有效语义信息。可选的,所述方法还包括:若所述新的文本片段的语义完整性概率得分大于或等于预设阈值,将所述历史文本片段从缓存中删除。可选的,所述方法还包括:若所述新的文本片段的语义完整性概率得分小于预设阈值,则将所述新的文本片段作为历史文本片段存储至缓存中。可选的,所述获取所述语音信息的有效语义信息之后,还包括:根据所述有效语义信息,获取所述语音信息对应的回复信息;控制所述智能设备输出所述回复信息。第二方面,本专利技术实施例提供一种信息处理装置,包括:获取模块,用于获取输入智能设备的语音信息;第一识别模块,用于对所述语音信息进行语音识别处理,得到所述语音信息对应的文本信息,所述文本信息包括至少一个词汇以及各所述词汇的时间信息,所述时间信息用于指示所述智能设备采集到所述词汇对应的语音帧的时间;切分模块,用于根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段;第二识别模块,用于根据所述至少一个文本片段的语义识别结果,获取所述语音信息的有效语义信息。可选的,所述切分模块具体用于:根据各所述词汇的时间信息,获取所述文本信息中相邻两个词汇之间的时间间隔;若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点;根据所确定的切分点,对所述文本信息进行切分,得到所述至少一个文本片段。可选的,所述切分模块具体用于:若所述时间间隔大于或等于目标阈值,则确定在所述两个词汇之间设置切分点。可选的,所述切分模块还用于:根据至少一个所述时间间隔,确定所述语音信息的语速等级;根据语速等级与时间阈值之间的对应关系,将与所述语音信息的语速等级对应的时间阈值作为所述目标阈值。可选的,所述切分模块还用于:根据所述文本信息的各所述时间间隔,获取所述时间间隔的第一平均值,并将所述第一平均值确定为所述目标阈值;或者,依次确定第一预设数量的词汇的时间间隔的第二平均值,并将所述第二平均值确定为所述第一预设数量的词汇之后的第二预设数量的词汇对应的目标阈值;或者,针对所述文本信息中的任意词汇,获取所述文本信息中位于所述词汇之前的所有词汇的时间间隔的第三平均值,将所述第三平均值作为所述词汇对应的目标阈值。可选的,所述语义识别结果包括:语义完整性概率得分和语义信息;所述第二识别模块具体用于:将语义完整性概率得分满足预设条件的文本片段的语义信息,作为所述语音信息的有效语义信息。可选的,所述第二识别模块具体用于:针对所述至少一个文本片本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,包括:/n获取输入智能设备的语音信息;/n对所述语音信息进行语音识别处理,得到所述语音信息对应的文本信息,所述文本信息包括至少一个词汇以及各所述词汇的时间信息,所述时间信息用于指示所述智能设备采集到所述词汇对应的语音帧的时间;/n根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段;/n根据所述至少一个文本片段的语义识别结果,获取所述语音信息的有效语义信息。/n

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:
获取输入智能设备的语音信息;
对所述语音信息进行语音识别处理,得到所述语音信息对应的文本信息,所述文本信息包括至少一个词汇以及各所述词汇的时间信息,所述时间信息用于指示所述智能设备采集到所述词汇对应的语音帧的时间;
根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段;
根据所述至少一个文本片段的语义识别结果,获取所述语音信息的有效语义信息。


2.根据权利要求1所述的方法,其特征在于,所述根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段,包括:
根据各所述词汇的时间信息,获取所述文本信息中相邻两个词汇之间的时间间隔;
若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点;
根据所确定的切分点,对所述文本信息进行切分,得到所述至少一个文本片段。


3.根据权利要求2所述的方法,其特征在于,所述若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点,包括:
若所述时间间隔大于或等于目标阈值,则确定在所述两个词汇之间设置切分点。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据至少一个所述时间间隔,确定所述语音信息的语速等级;
根据语速等级与时间阈值之间的对应关系,将与所述语音信息的语速等级对应的时间阈值作为所述目标阈值。


5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述文本信息的各所述时间间隔,获取所述时间间隔的第一平均值,并将所述第一平均值确定为所述目标阈值;或者,
依次确定第一预设数量的词汇的时间间隔的第二平均值,并将所述第二平均值确定为所述第一预设数量的词汇之后的第二预设数量的词汇对应的目标阈值;或者...

【专利技术属性】
技术研发人员:韩伟
申请(专利权)人:北京猎户星空科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1