语音意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38469168 阅读:12 留言:0更新日期:2023-08-11 14:46
本发明专利技术提出一种语音意图识别方法、装置、电子设备及存储介质,该方法包括:通过获取目标文本数据,根据目标文本数据匹配出多个第一备选标签,从而得到第一备选语义数据,根据第一备选语义数据确定出优选语义数据,并通过将优选语义数据与目标文本数据进行相似度计算,从而判断出优选语义数据对应的优选语义意图是否符合用户实际意图。因此,本发明专利技术在确定优选语义数据后,还要判断优选语义数据与目标文本数据的相似度才能确定出用户真实意图,即通过多重比对方式确定用户的实际意图,提高了用户意图的判断准确性,提高用户体验。提高用户体验。提高用户体验。

【技术实现步骤摘要】
语音意图识别方法、装置、电子设备及存储介质


[0001]本专利技术涉及语音识别
,具体涉及一种语音意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着信息技术和人工智能的发展,语音识别技术得到了广泛的应用。例如,一些企业会用智能语音技术代替客服人员来协助用户办理业务或提供服务,而为了提高服务效率,通常还可对用户说的话进行意图识别,根据识别出的用户意图选择相应的回应或操作。
[0003]相关技术在基于用户的语音信息对用户进行意图识别时,往往是将用户的语音信息和该语音信息转换成的文本,作为识别用户意图的模型的输入,并根据该识别用户意图的模型的输出,确定出一个该用户的意图。但是,单一的输出结果,只能对一些用户意图较为简单的语音进行意图识别,而当用户处于复杂的语境和环境下,用户的意图则较为复杂,若只根据用户的语音信息和对应文本难以准确确定出用户实际意图。例如在与用户交互时,用户使用了容易被识别成同音字词或者谐音字词的字或词汇,导致在将该用户的语音转换成文本后,文本被错误识别成对应的同音字词或者谐音字词,导致文本含义改变。因此,在相关技术中,仅根据用户的语音信息和对应文本难以识别出这些情况下用户的真正意图,这就导致用户意图识别不准确,甚至出错。

技术实现思路

[0004]本专利技术提供语音意图识别方法、装置、电子设备及存储介质,以解决上述语音意图识别不准确的技术问题。
[0005]本专利技术实施例提供的一种语音意图识别方法,所述语音意图识别方法包括:获取待识别语音数据,对所述待识别语音数据进行识别,得到初始文本数据;根据所述初始文本数据和预设的修正文本数据生成目标文本数据;根据目标文本数据在预先设立的目标文本数据

第一备选标签对应关系中匹配出第一备选标签,根据第一备选标签在预先设立的第一备选标签

第一备选语义数据对应关系中匹配出第一备选语义数据;根据多个所述第一备选语义数据确定优选语义数据;将所述优选语音数据与目标文本数据进行相似度计算,以根据计算结果完成语音意图识别。
[0006]于本专利技术的一实施例中,根据所述初始文本数据和预设的修文本数据生成目标文本数据,所述修正文本数据包括位置环境文本数据和习惯文本数据,包括以下至少之一:将所述位置环境文本数据对所述初始文本数据进行修正,生成目标文本数据;将所述习惯文本数据对所述初始文本数据进行修正,生成目标文本数据。
[0007]于本专利技术的一实施例中,分别将多个所述第一备选语义数据与所述初始文本数据进行相似度计算,得到多个第一相似度,将大于第一预设相似度阈值的第一相似度对应的第一备选语义数据,确定为优选语义数据;将多个所述第一备选标签进行拟合,得到第二备选标签,根据所述第二备选标签在预先设立的第二备选标签

第二备选语义数据对应关系
中匹配出第二备选语义数据,将所述第二备选语义数据确定为优选语义数据。将所述第一备选语义数据对应的备选语音意图进行拟合,得到第三备选标签,根据所述第三备选标签在预先设立的第三备选标签

第三备选语义数据对应关系中匹配出第三备选语义数据,将所述第三备选语义数据确定为优选语义数据。
[0008]于本专利技术的一实施例中,将所述优选语音数据与目标文本数据进行相似度计算,以根据计算结果完成语音意图识别,包括:将所述优选语义数据与所述目标文本数据的进行相似度计算,得到第二相似度;若所述第二相似度大于预设的第二相似度阈值,则判定所述优选语义数据对应的优选语义意图符合用户意图。
[0009]于本专利技术的一实施例中,在根据多个第一备选语义数据获得优选语义数据之后,还包括:获取历史移动轨迹数据中的历史位置数据;将所述历史位置数据与所述优选语义数据的地点进行匹配;若匹配成功,则判定所述优选语义数据对应的优选语义意图符合用户意图。
[0010]于本专利技术的一实施例中,获取待识别语音数据,对所述待识别语音数据进行识别,得到初始文本数据,还包括:对所述待识别语音数据的最后一个字/词进行单独声源识别,识别出语音音调;根据所述语音音调判定所述初始文本数据的词句类型。
[0011]于本专利技术的一实施例中,在根据所述初始文本数据和修正文本数据生成目标文本数据之前,还包括:对所述待识别语音数据进行缺失检测,得到检测结果;若检测结果为存在缺失,则根据所述初始文本数据在预设的初始文本数据

目标样本语料文本数据的对应关系中匹配出目标样本预料数据;根据所述目标样本语料文本数据对所述初始文本数据进行补全。
[0012]于本专利技术的一实施例中,提供一种语音意图识别装置,包括:获取模块,获取多个待识别语音数据,对所述待识别语音数据进行识别,获得多个初始文本数据;生成模块,根据所述初始文本数据和预设的修正文本数据生成目标文本数据;匹配模块,根据目标文本数据在预先设立的目标文本数据

第一备选标签对应关系中匹配出第一备选标签,根据第一备选标签在预先设立的第一备选标签

第一备选语义数据对应关系中匹配出第一备选语义数据;确定模块,根据多个所述第一备选语义数据确定优选语义数据;计算模块,将所述优选语音数据与目标文本数据进行相似度计算,以根据计算结果完成语音意图识别。
[0013]本专利技术的有益效果:通过获取目标文本数据,根据目标文本数据匹配出多个第一备选标签,从而得到第一备选语义数据,根据第一备选语义数据确定出优选语义数据,并通过将优选语义数据与目标文本数据进行相似度计算,从而判断出优选语义数据对应的优选语义意图是否符合用户实际意图。因此,本专利技术在确定优选语义数据后,还要判断优选语义数据与目标文本数据的相似度才能确定出用户真实意图,即通过多重比对方式确定用户的实际意图,提高了用户意图的判断准确性,提高用户体验。
[0014]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0015]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请
的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0016]图1是本专利技术的一示例性实施例示出的语音意图识别方法架构的示意图;
[0017]图2是本专利技术的一示例性实施例示出的语音意图识别方法的具体流程图;
[0018]图3是本专利技术的一示例性实施例示出的向量语义空间展示图;
[0019]图4是本专利技术的一示例性实施例示出的利用第一备选语义数据获取优选语义数据展示图;
[0020]图5是本专利技术的一示例性实施例示出的利用第一备选语义数据对应的第一备选意图获取优选语义数据展示图;
[0021]图6是本专利技术的一示例性实施例示出的语音意图识别装置的具体示意图;
[0022]图7是用来实现本专利技术实施例的电子设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音意图识别方法,其特征在于,所述语音意图识别方法包括:获取待识别语音数据,对所述待识别语音数据进行识别,得到初始文本数据;根据所述初始文本数据和预设的修正文本数据生成目标文本数据;根据目标文本数据在预先设立的目标文本数据

第一备选标签对应关系中匹配出第一备选标签,根据第一备选标签在预先设立的第一备选标签

第一备选语义数据对应关系中匹配出第一备选语义数据;根据多个所述第一备选语义数据确定优选语义数据;将所述优选语音数据与所述目标文本数据进行相似度计算,以根据计算结果完成语音意图识别。2.根据权利要求1所述的语音意图识别方法,其特征在于,根据所述初始文本数据和预设的修正文本数据生成目标文本数据,所述修正文本数据包括位置环境文本数据和习惯文本数据,包括以下至少之一:将所述位置环境文本数据对所述初始文本数据进行修正,生成目标文本数据;将所述习惯文本数据对所述初始文本数据进行修正,生成目标文本数据。3.根据权利要求1所述的语音意图识别方法,其特征在于,根据多个所述第一备选语义数据确定优选语义数据,包括以下至少之一:分别将多个所述第一备选语义数据与所述初始文本数据进行相似度计算,得到多个第一相似度,将大于第一预设相似度阈值的第一相似度对应的第一备选语义数据,确定为优选语义数据;将多个所述第一备选标签进行拟合,得到第二备选标签,根据所述第二备选标签在预先设立的第二备选标签

第二备选语义数据对应关系中匹配出第二备选语义数据,将所述第二备选语义数据确定为优选语义数据;将所述第一备选语义数据对应的备选语音意图进行拟合,得到第三备选标签,根据所述第三备选标签在预先设立的第三备选标签

第三备选语义数据对应关系中匹配出第三备选语义数据,将所述第三备选语义数据确定为优选语义数据。4.根据权利要求1至3任一项所述的语音意图识别方法,其特征在于,将所述优选语音数据与所述目标文本数据进行相似度计算,以根据计算结果完成语音意图识别,包括:将所述优选语义数据与所述目标文本数据的进行相似度计算,得到第二相似度;若所述第二相似度大于预设的第二相似度阈值,则判定所述优选语义数据对应的优选语义意图符合用...

【专利技术属性】
技术研发人员:白家军陈楚
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1