语义理解方法、电子设备和存储介质技术

技术编号:39441693 阅读:16 留言:0更新日期:2023-11-19 16:24
本发明专利技术公开语义理解方法、电子设备和存储介质,其中,一种语义理解方法,包括:将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。通过在领域分类模型上增加跨领域分类结果,从而实现了单领域多意图和跨领域多意图的语义解析,进一步地,基于领域预测结果使用分句模型进行切句,从而可以让语义理解更加准确。语义理解更加准确。语义理解更加准确。

【技术实现步骤摘要】
语义理解方法、电子设备和存储介质


[0001]本申请实施例涉及语音识别
,特别是涉及一种语义理解方法、电子设备和存储介质。

技术介绍

[0002]近几年,由于对话系统的技术发展,越来越多的口语人机交互设备进入了广大人民群众的生活之中,比如家庭智能音箱、家庭智能电视,以及诸多的新能源汽车、地铁购票机等都开始大量搭载语音交互设备和功能。
[0003]在口语语义理解领域,一个句子单个意图的交互需求已经不能满足用户的需求。因此,支持一句话多意图的口语语义理解技术和方法成为了新的研究和应用热点。
[0004]现有技术中,一般使用序列标注模型对用户的输入语句进行槽位填充。其中,数据标签的设计针对多意图进行了适配和优化;每个令牌的标注格式会引入当前意图的信息,即表达了槽位和意图的归属关系。或者在槽位识别模型前先对每个词进行粗标签分类并将其利用进模型的训练输入数据中,以便于增加模型的泛化性,以此实现在跨领域的零样本槽填充。这些方法只能对训练过的多意图进行预测,例如训练数据中最多只有3个意图,则当输入句子的意图数量大于3时,预测精度会显著下降。而端到端的序列标注方式,随着意图数量的增加,数据的标签数量会呈倍数增加,在超多意图情景下,若不提高模型的参数量,模型预测精度会较低。

技术实现思路

[0005]本专利技术实施例提供了一种语义理解方法、电子设备和存储介质,用于至少解决上述技术问题之一。
[0006]第一方面,本专利技术实施例提供了一种语义理解方法,包括:将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
[0007]第二方面,本专利技术实施例提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术上述任一项语义理解方法。
[0008]第三方面,本专利技术实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本专利技术上述任一项语义理解方法。
[0009]第四方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括
存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项语义理解方法。
[0010]本申请的方法通过构建了一种基于序列标注的抽取式分句模型的设计,从而可以实现多意图句子的切分,在分句任务上达到更高的准确率,同时在多意图迁移能力上也有更好的表现,进一步地,通过基于分句模型的方法实现对多意图句子的语义解析,同时在领域分类模型上增加跨领域分类结果,从而可以实现单领域多意图和跨领域多意图的语义解析,由于领域内槽位模型只需要对单意图句子进行解析,不需要额外的训练,引入分句模型后,即可无感支持多意图语义解析。
附图说明
[0011]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0012]图1为本专利技术一实施例提供的一种语义理解方法的流程图;
[0013]图2为本专利技术一实施例提供的另一种语义理解方法的流程图;
[0014]图3为本专利技术一实施例提供的又一种语义理解方法的流程图;
[0015]图4为本专利技术一实施例提供的语义理解方法的一个具体示例的车载控制领域分句模型结构图;
[0016]图5为本专利技术一实施例提供的语义理解方法的一个具体示例的领域内句子的序列标注图;
[0017]图6为本专利技术一实施例提供的语义理解方法的一个具体示例的传统分类与跨领域分类的区别图;
[0018]图7为本专利技术一实施例提供的语义理解方法的一个具体示例的分句数据的标注格式图;
[0019]图8为本专利技术一实施例提供的语义理解方法的一个具体示例的位数据的标注格式图;
[0020]图9为本专利技术一实施例提供的语义理解方法的一个具体示例的语义理解流程图;
[0021]图10是本专利技术一实施例提供的电子设备的结构示意图。
具体实施方式
[0022]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]请参考图1,其示出了本专利技术一实施例提供的一种语义理解方法的流程图。
[0024]如图1所示,在步骤101中,将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;
[0025]在步骤102中,若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;
[0026]在步骤103中,若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
[0027]在本实施例中,对于步骤101,语义理解装置将用户输入送入领域分类模型得到用户输入对应的领域预测结果,其中,领域分类模型用于预测句子所属的一个或多个领域,例如,用户输入的句子会被送入领域分类模型得到句子所属于领域的分类结果,领域分类模型的输出可以是单个领域,或多个领域的跨领域结果,以“打开车窗”这一单领域句子为例,领域分类模型给出的领域预测结果就是“车载控制”;若用户输入是“播放音乐然后打开空调”这一跨领域句子,领域分类模型给出的领域预测结果就是“音乐#车载控制,音乐#家居控制”。
[0028]然后,对于步骤102,若领域预测结果仅对应单个领域,使用对应于单个领域的分句模型对用户输入进行分句得到至少一个子句,其中,分句模型可以使用基于预训练模型Bert的序列标志模型,例如,当用户输入的句子被确定所属领域后,会被送入分句模型进行子句的切分,通过对分句模型输出标注提取出预设槽位名的槽位值,即获得所有该领域下可解析的子句,其中,在分句模型中,标签的类别包括对应领域子句的起始位置和其他位置和其他领域的子句的起始位置和其他位置,以“打开车窗然后空调调高二十度”是用户输入为例,将用户输入送入车载控制领域下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义理解方法,包括:将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。2.权利要求1所述的方法,其中,在若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句之后,所述方法还包括:对于每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图;对所述各子句的槽位和意图进行合并得到所述用户输入的语义输出。3.权利要求1所述的方法,其中,在若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句之后,所述方法还包括:对于当前领域下每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图;对于所述当前领域下所述各子句的槽位和意图进行合并得到当前领域语义输出;将多个领域对应的多个当前领域语义输出进行融合得到所述用户输入的语义输出。4.根据权利要求1所述的方法,其中,所述使...

【专利技术属性】
技术研发人员:蒋胜朱苏缪庆亮俞凯
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1