一种语义泛化的方法、系统、电子设备、存储介质及车辆技术方案

技术编号:38712325 阅读:7 留言:0更新日期:2023-09-08 14:55
本申请公开了一种语义泛化的方法、系统、电子设备、存储介质及车辆,包括基于语义模板,生成语义模型训练所需的语义数据;根据语义模板和语义数据对语义模型进行训练;基于线上语义数据的聚类权重和预测权重,计算泛化值;当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化;其中,线上语义数据的预测权重通过语义模型生成。通过上述方法,可以快速筛选出相同意图下的泛化数据,准确找出相同意图下的同类语义的泛化。图下的同类语义的泛化。图下的同类语义的泛化。

【技术实现步骤摘要】
一种语义泛化的方法、系统、电子设备、存储介质及车辆


[0001]本专利技术涉及语义处理
,特别是涉及一种语义泛化的方法、系统、电子设备、存储介质及车辆。

技术介绍

[0002]近年来,随着人工智能、芯片技术的发展,带动汽车行业新革新——智能汽车越来越受欢迎。智能汽车由车联网、智能座舱、自动驾驶三部分组成。智能座舱配备了智能化和网联化的车载软件,可以与人、路、车进行智能交互,是人车关系从工具向伙伴演进的重要纽带和关键节点。智能驾舱将人们从枯燥的驾驶操作中解脱出来,通过语音对话就可以完成对汽车功能的操作,从而减少双手脱离方向盘引发的安全问题,使得智能座舱成为人们驾驶、休息、娱乐、工作的地方。语音交互则是智能驾驶舱中最核心的功能之一。
[0003]车载语音交互领域,如何从浩瀚的线上数据中快速准确地筛选出对模型泛化有效的数据,让模型可以理解越来越广泛的人类的语言,变得越来越智能,即提高模型的泛化能力,一直是一个棘手的问题。
[0004]因此,如何快速筛选出相同意图下的泛化数据,准确找出相同意图下的同类语义的泛化,是本领域技术人员有待解决的技术问题。

技术实现思路

[0005]为解决现有技术中的车载语音交互领域不能快速筛选出相同意图下的泛化数据,不能准确找出相同意图下的同类语义的泛化的技术问题,本专利技术提供一种语义泛化的方法、系统、电子设备、存储介质及车辆。
[0006]为实现本专利技术目的提供的一种语义泛化的方法,包括:
[0007]基于语义模板,生成语义模型训练所需的语义数据;
[0008]根据语义模板和语义数据对语义模型进行训练;
[0009]基于线上语义数据的聚类权重和预测权重,计算泛化值;
[0010]当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化;
[0011]其中,线上语义数据的预测权重通过语义模型生成。
[0012]在其中一些具体实施例中,所述语义模板具体包括:
[0013]基于应用场景,结合语句规则创建语义模板。
[0014]在其中一些具体实施例中,当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化之前,所述方法还包括:
[0015]根据语义模型,基于线上语义数据的聚类结果,判断线上语义数据是否为同类语义的泛化。
[0016]在其中一些具体实施例中,根据语义模板和语义数据对语义模型进行训练,具体包括:
[0017]根据语义模板生成常见说法作为第一语义模型对语义数据进行初步训练;
[0018]根据初步训练后的语义数据采用第二语义模型进行深度训练。
[0019]在其中一些具体实施例中,基于线上语义数据的聚类权重和预测权重,计算泛化值,具体包括:
[0020]将线上语义数据进行聚类,根据聚类簇大小对每条数据赋予权重;
[0021]根据语义模型对数据进行预测,并将预测结果的分数值转换为权重;
[0022]将聚类权重和预测权重进行融合计算泛化值。
[0023]在其中一些具体实施例中,判断线上语义数据是否为同类语义的泛化,具体包括:
[0024]当语义模型对线上语义数据的分类结果相同,且聚类同一簇,则直接认为是泛化说法;
[0025]当语义模型对线上语义数据的分类结果不相同,且聚类不是同一簇,则直接认为互相不是泛化说法。
[0026]基于同一构思,本专利技术还提供一种语义泛化的系统,包括:
[0027]语义数据生成模块,用于基于语义模板,生成语义模型训练所需的语义数据;
[0028]语义模型训练模块,用于根据语义模板和语义数据对语义模型进行训练;
[0029]泛化值计算模块,用于基于线上语义数据的聚类权重和预测权重,计算泛化值;
[0030]语义泛化判断模块,用于当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化;
[0031]其中,线上语义数据的预测权重通过语义模型生成。
[0032]基于同一构思,本专利技术还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;所述存储器中存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述语义泛化的方法的步骤。
[0033]基于同一构思,本专利技术还提供一种计算机可读存储介质,其存储有可由电子设备执行的计算机程序,当所述计算机程序在所述电子设备上运行时,使得所述电子设备执行上述语义泛化的方法的步骤。
[0034]基于同一构思,本专利技术还提供一种车辆,所述车辆搭载有如上所述的语义泛化的系统。
[0035]与现有技术相比,本专利技术具有以下有益效果:
[0036]本专利技术公开了一种语义泛化的方法、系统、电子设备、存储介质及车辆,包括基于语义模板,生成语义模型训练所需的语义数据;根据语义模板和语义数据对语义模型进行训练;基于线上语义数据的聚类权重和预测权重,计算泛化值;当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化;其中,线上语义数据的预测权重通过语义模型生成。通过上述方法,可以快速筛选出相同意图下的泛化数据,准确找出相同意图下的同类语义的泛化。
附图说明
[0037]图1是本专利技术一种语义泛化的方法在一些具体实施例的结构示意图;
[0038]图2是本专利技术一种语义泛化的方法在一些应用中的流程图;
[0039]图3是图2中聚类结果的示意图;
[0040]图4是本专利技术一种语义泛化的系统在一些具体实施例的结构示意图;
[0041]图5是本专利技术一种电子设备在一些具体实施例的结构示意图。
具体实施方式
[0042]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0043]在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
[0044]应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0045]应当理解,尽管在本申请实施例中可能采用术语第一、第二、第三等来描述,但这些描述不应限于这些术语。这些术语仅用来将描述区分开。例如,在不脱离本申请实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。
[0046]取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义泛化的方法,其特征在于,包括:基于语义模板,生成语义模型训练所需的语义数据;根据语义模板和语义数据对语义模型进行训练;基于线上语义数据的聚类权重和预测权重,计算泛化值;当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化;其中,线上语义数据的预测权重通过语义模型生成。2.根据权利要求1所述的语义泛化的方法,其特征在于,所述语义模板具体包括:基于应用场景,结合语句规则创建语义模板。3.根据权利要求1所述的语义泛化的方法,其特征在于,当泛化值大于预设泛化阈值时,则线上语义数据为同类语义的泛化之前,所述方法还包括:根据语义模型,基于线上语义数据的聚类结果,判断线上语义数据是否为同类语义的泛化。4.根据权利要求1所述的语义泛化的方法,其特征在于,根据语义模板和语义数据对语义模型进行训练,具体包括:根据语义模板生成常见说法作为第一语义模型对语义数据进行初步训练;根据初步训练后的语义数据采用第二语义模型进行深度训练。5.根据权利要求1所述的语义泛化的方法,其特征在于,基于线上语义数据的聚类权重和预测权重,计算泛化值,具体包括:将线上语义数据进行聚类,根据聚类簇大小对每条数据赋予权重;根据语义模型对数据进行预测,并将预测结果的分数值转换为权重;将聚类权重和预测权重进行融合计算泛化值。6.根据权利要求3所述的语义泛化...

【专利技术属性】
技术研发人员:张伦齐
申请(专利权)人:一汽北京软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1