信息处理方法、装置及电子设备制造方法及图纸

技术编号:25990026 阅读:20 留言:0更新日期:2020-10-20 18:58
本发明专利技术实施例提供一种信息处理方法、装置及电子设备,该方法包括:获取待识别的文本信息,依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息;由此可见,本实施例中在进行语义识别之前,无需对语音信息或者文本信息进行任何预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,由于是对各语言单元实时进行语义识别处理,提高了语义识别的实时性。

【技术实现步骤摘要】
信息处理方法、装置及电子设备
本专利技术实施例涉及人工智能
,尤其涉及一种信息处理方法、装置及电子设备。
技术介绍
随着人机交互技术的发展,语义识别技术显示出其重要性。语义识别是从人类发出的语音信号中提取特征信息并确定其语言含义的过程,主要包括语音识别过程和语义理解过程。语音识别过程是利用声学模型将人类的语音信号转换为文本的过程,语义理解过程是利用自然语言模型对文本的含义进行识别的过程。现有技术中,在对用户输入的语音信号进行处理时,首先利用语音活动性检测(voiceactivitydetection,VAD)技术,在连续的语音信号中确定出各个语音片段的起始点和终止点,实现对连续语音信号的切分,然后对切换后的语音片段进行语音识别和语义理解,以得到用户的语义。然而,在实际应用中,由于不同用户的说话语速、说话习惯以及说话人所处场景的不同,通过VAD检测的方式对语句进行切分,使得对语句的切分不够准确,进而导致语义识别的准确率不高。
技术实现思路
本专利技术实施例提供一种信息处理方法、装置及电子设备,用以提高语义识别的准确率。第一方面,本专利技术实施例提供一种信息处理方法,包括:获取待识别的文本信息;依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。可选的,所述语义识别结果包括:语义完整性概率得分和语义信息,所述根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息,包括:若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。可选的,所述若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,包括:针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;其中,所述第三语言单元为所述第一语言单元之后且与所述第一语言单元相邻的语言单元。可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元与第四语言单元之前的各语言单元拼接得到的语言单元的语义完整性概率得分均小于或等于所述第二语言单元的完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;其中,所述第四语言单元位于所述第一语言单元之后,且所述第四语言单元与所述第一语言单元之间间隔预设数量的语言单元。可选的,所述方法还包括:若所述第二语言单元的语义完整性概率得分满足设定条件,将所述历史语言单元从缓存中删除。可选的,所述方法还包括:若所述第二语言单元的语义完整性概率得分不满足设定条件,则将所述第二语言单元确定为所述历史语言单元,并缓存至缓存中。可选的,所述将所述第二语言单元的语义信息作为所述文本信息的有效语义信息之后,还包括:获取已缓存的预测语义信息和所述预测语义信息对应的预测回复信息,所述预测语义信息是根据所述历史语言单元的语义信息进行预测得到的;若所述有效语义信息和所述预测语义信息一致,则将所述预测回复信息作为所述文本信息对应的回复信息。可选的,所述获取待识别的文本信息之前,还包括:获取输入智能设备的语音信息,并对所述语音信息进行语音识别处理,得到待识别的文本信息。可选的,确定所述文本信息的有效语义信息之后,还包括:根据所述有效语义信息,获取所述文本信息对应的回复信息;控制智能设备输出所述回复信息。第二方面,本专利技术实施例提供一种信息处理装置,包括:获取模块,用于获取待识别的文本信息;第一识别模块,用于依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。可选的,所述语义识别结果包括:语义完整性概率得分和语义信息,所述第一识别模块具体用于:若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。可选的,所述第一识别模块具体用于:针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。可选的,所述第一识别模块具体用于:若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。可选的,所述第一识别模块具体用于:若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;其中,所述第三语言单元为所述第一语言单元之后且与所述第一语言单元相邻的语言单元。可选的,所述第一识别模块具体用于:若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元与第四语言单元之前的各语言单元拼接得到的语言单元的语义完整性概率得分均小于或等于所述第二语言单元的完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;其中,所述第四语言单元位于所述第一语言单元之后,且所述第四语言单元与所本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,包括:/n获取待识别的文本信息;/n依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。/n

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:
获取待识别的文本信息;
依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。


2.根据权利要求1所述的方法,其特征在于,所述语义识别结果包括:语义完整性概率得分和语义信息,所述根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息,包括:
若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。


3.根据权利要求2所述的方法,其特征在于,所述若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,包括:
针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;
对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;
若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。


4.根据权利要求3所述的方法,其特征在于,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:
若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。


5.根据权利要求3所述的方法,其特征在于,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:
若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述...

【专利技术属性】
技术研发人员:韩伟
申请(专利权)人:北京猎户星空科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1