语义理解模板的生成方法技术

技术编号:39516989 阅读:8 留言:0更新日期:2023-11-25 18:54
本申请公开了一种语义理解模板的生成方法

【技术实现步骤摘要】
语义理解模板的生成方法、装置、存储介质及电子装置


[0001]本申请涉及智慧家庭
,具体而言,涉及一种语义理解模板的生成方法

装置

存储介质及电子装置


技术介绍

[0002]目前,越来越多的智能设备开始配备语音交互功能,通过对用户语音数据的重点词语进行解析,确定出用户的交互意图,比如,对于用户数据“我想知道北京明天的天气是什么”可以确定重点词语是地点“北京”以及时间“明天”,继而使用数据模板得到用户的交互意图为“查天气”。
但是这种方法所使用的数据模板往往由人工编写,费时费力,编写效率很低,效率低下

[0003]因此,相关技术中,存在如何解决语义理解模板的生成效率低下的技术问题

[0004]针对相关技术中,如何解决语义理解模板的生成效率低下的技术问题,尚未提出有效的解决方案


技术实现思路

[0005]本申请实施例提供了一种语义理解模板的生成方法

装置

存储介质及电子装置,以至少解决相关技术中,语义理解模板的生成效率低下的技术问题

[0006]根据本申请实施例的一个实施例,提供了一种语义理解模板的生成方法,包括:对语音交互数据进行预收集,得到业务数据;根据所述业务数据的业务来源对所述业务数据进行分组,得到多组目标数据;确定出所述多组目标数据的每一组目标数据的预设词汇,并根据所述预设词汇生成所述每一组目标数据对应的语义理解模板,以供基于语义理解模板对接收到的语音交互数据进行语义处理

[0007]在一个示例性实施例中,根据所述业务数据的业务来源对所述业务数据进行分类,得到多组目标数据,包括:确定所述业务数据的业务类型是否属于预设业务类型;在所述业务数据的业务类型属于所述预设业务类型的情况下,获取所述业务数据对应的多种业务来源;根据所述多种业务来源对所述业务数据进行分类,得到多组目标数据

[0008]在一个示例性实施例中,获取所述业务数据对应的多种业务来源,包括:获取所述业务数据携带的数据标识符,其中,所述数据标识符对应于所述业务数据的不同业务来源;在确定所述数据标识符指示所述业务数据为业务时间的情况下,确定所述业务数据的业务来源为业务执行时间;在确定所述数据标识符指示所述业务数据为业务地点的情况下,确定所述业务数据的业务来源为业务执行地点;在确定所述数据标识符指示所述业务数据为业务环境的情况下,确定所述业务数据的业务来源为业务执行环境

[0009]在一个示例性实施例中,根据所述多种业务来源对所述业务数据进行分类,得到多组目标数据,包括:针对属于所述多种业务来源的任一种业务来源的第一类业务数据,获取所述第一类业务数据中的多条业务交互语句;确定出所述多条业务交互语句中每一条业务交互语句的第一业务实体词,将具有相同第一业务实体词的业务交互语句设置为第一业
务数据,得到所述第一类业务数据对应的多组第一业务数据;针对属于其他业务来源的第二类业务数据,获取所述第二类业务数据中的多条业务交互语句,其中,所述其他业务来源表示所述多种业务来源中除了所述任一种业务来源之外的业务来源;确定出所述多条业务交互语句中每一条业务交互语句的第二业务实体词,将具有相同第二业务实体词的业务交互语句设置为第二业务数据,得到所述第一类业务数据对应的多组第二业务数据;根据所述多组第一业务数据和所述多组第二业务数据确定出所述多组目标数据

[0010]在一个示例性实施例中,在将具有相同第一业务实体词的业务交互语句设置为第一业务数据之前,所述方法还包括:获取所述第一类业务数据中的多条业务交互语句中的任一条业务交互语句对应的字符串,其中,所述字符串中的元素用于指示所述任一条业务交互语句中的字段;确定出所述字符串的任一个字段在所述第一类业务数据中的多条业务交互语句中出现的第一次数;在确定所述任一个字段在所述第一类业务数据中的多条业务交互语句中的第一次数大于预设次数的情况下,确定出具有所述任一个字段的一组交互语句,其中,所述预设次数不大于所述第一类业务数据中的多条业务交互语句的个数;从所述一组交互语句中确定出具有相同第一业务实体词的业务交互语句

[0011]在一个示例性实施例中,根据所述预设词汇生成所述每一组目标数据对应的语义理解模板,包括:从预设交互数据库内获取与所述预设词汇具有关联关系的一组交互信息;确定出所述一组交互信息中的各个交互信息在所述预设交互数据库内出现的第二次数;将所述一组交互信息中出现的所述第二次数最高的交互信息确定为目标交互信息,并根据所述目标交互信息生成所述语义理解模板

[0012]在一个示例性实施例中,根据所述目标交互信息生成所述语义理解模板,包括:确定出所述目标交互信息中的实体词;从实体词词库内获取所述实体词对应的实体词标签;使用所述实体词标签替换所述目标交互信息中的所述实体词,以生成所述语义理解模板

[0013]根据本申请实施例的另一个实施例,还提供了一种语义理解模板的生成装置,包括:采集模块,用于对语音交互数据进行预收集,得到业务数据;分组模块,用于根据所述业务数据的业务来源对所述业务数据进行分组,得到多组目标数据;生成模块,用于确定出所述多组目标数据的每一组目标数据的预设词汇,并根据所述预设词汇生成所述每一组目标数据对应的语义理解模板,以供基于语义理解模板对接收到的语音交互数据进行语义处理

[0014]根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语义理解模板的生成方法

[0015]根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的语义理解模板的生成方法

[0016]在本申请实施例中,对语音交互数据进行预收集,得到业务数据;根据所述业务数据的业务来源对所述业务数据进行分组,得到多组目标数据;确定出所述多组目标数据的每一组目标数据的预设词汇,并根据所述预设词汇生成所述每一组目标数据对应的语义理解模板,以基于语义理解模板对接收到的语音交互数据进行语义处理;采用上述技术方案,解决了语义理解模板的生成效率低下的技术问题,进而提高了语义理解模板的生成效率

附图说明
[0017]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理

[0018]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图
...

【技术保护点】

【技术特征摘要】
1.
一种语义理解模板的生成方法,其特征在于,包括:对语音交互数据进行预收集,得到业务数据;根据所述业务数据的业务来源对所述业务数据进行分组,得到多组目标数据;确定出所述多组目标数据的每一组目标数据的预设词汇,并根据所述预设词汇生成所述每一组目标数据对应的语义理解模板,以供基于语义理解模板对接收到的语音交互数据进行语义处理
。2.
根据权利要求1所述的语义理解模板的生成方法,其特征在于,根据所述业务数据的业务来源对所述业务数据进行分类,得到多组目标数据,包括:确定所述业务数据的业务类型是否属于预设业务类型;在所述业务数据的业务类型属于所述预设业务类型的情况下,获取所述业务数据对应的多种业务来源;根据所述多种业务来源对所述业务数据进行分类,得到多组目标数据
。3.
根据权利要求2所述的语义理解模板的生成方法,其特征在于,获取所述业务数据对应的多种业务来源,包括:获取所述业务数据携带的数据标识符,其中,所述数据标识符对应于所述业务数据的不同业务来源;在确定所述数据标识符指示所述业务数据为业务时间的情况下,确定所述业务数据的业务来源为业务执行时间;在确定所述数据标识符指示所述业务数据为业务地点的情况下,确定所述业务数据的业务来源为业务执行地点;在确定所述数据标识符指示所述业务数据为业务环境的情况下,确定所述业务数据的业务来源为业务执行环境
。4.
根据权利要求2所述的语义理解模板的生成方法,其特征在于,根据所述多种业务来源对所述业务数据进行分类,得到多组目标数据,包括:针对属于所述多种业务来源的任一种业务来源的第一类业务数据,获取所述第一类业务数据中的多条业务交互语句;确定出所述多条业务交互语句中每一条业务交互语句的第一业务实体词,将具有相同第一业务实体词的业务交互语句设置为第一业务数据,得到所述第一类业务数据对应的多组第一业务数据;针对属于其他业务来源的第二类业务数据,获取所述第二类业务数据中的多条业务交互语句,其中,所述其他业务来源表示所述多种业务来源中除了所述任一种业务来源之外的业务来源;确定出所述多条业务交互语句中每一条业务交互语句的第二业务实体词,将具有相同第二业务实体词的业务交互语句设置为第二业务数据,得到所述第一类业务数据对应的多组第二业务数据;根据所述多组第一业务数据和所述多组第二业务数据确定出所述多组目标数据
。5.
根据权利要求4所述的语义理解...

【专利技术属性】
技术研发人员:马志芳
申请(专利权)人:海尔优家智能科技北京有限公司海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1