一种相似命令文本的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:34631237 阅读:15 留言:0更新日期:2022-08-24 15:03
本发明专利技术公开了一种相似命令文本的生成方法、装置、设备及存储介质,该方法包括:获取命令数据集,对所述命令数据集进行语料处理,生成句法模板与相似句对;基于所述句法模板与所述相似句对对预设文本生成模型进行训练,生成相似文本生成模型;将所述命令数据集与所述句法模板输入上述所述文本生成模型,生成相似命令文本。本方法实现了相似命令文本自动生成,对命令数据集进行了有效增广,充分覆盖了设备命令的各类语法表达形式。命令的各类语法表达形式。命令的各类语法表达形式。

【技术实现步骤摘要】
一种相似命令文本的生成方法、装置、设备及存储介质


[0001]本专利技术涉及数据处理领域,具体涉及一种相似命令文本的生成方法、装置、设备及存储介质。

技术介绍

[0002]目前采用语音控制诸如照明、空调、电视、窗帘等家居使用的设备,大部分基于固定的设备命令词表,用户读出设备命令词表所包含的命令词,意图识别算法识别意图并执行该命令。如果用户的命令表述超出词表范围,意图识别算法就不能识别该命令意图,则执行不了该命令。举例来说,词表中有“打开空调”这个命令,用户说“打开空调”就可以打开空调,但是说“开开空调”就不能打开空调了。
[0003]为了避免让用户记忆命令词表,使用更灵活多样的命令表述形式,意图识别算法需要学习足够多的相同语义不同表述的设备命令数据集。当前主要通过人工采集的方式获取设备命令数据集,但人工获取数据集的成本很高,而且获取的数据比较离散,不能充分获取各种语法形式的表达,由此导致意图识别的鲁棒性不足。
[0004]因此,如何对已有的数据集进行有效数据增广,获取覆盖各类语法模式的相同语义命令表述是本领域技术人员亟待解决的问本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种相似命令文本的生成方法,其特征在于,包括如下步骤:获取命令数据集,对所述命令数据集进行语料处理,生成句法模板与相似句对;基于所述句法模板与所述相似句对对预设文本生成模型进行训练,生成相似文本生成模型;将所述命令数据集与所述句法模板输入上述所述文本生成模型,生成相似命令文本。2.根据权利要求1所述的一种相似命令文本的生成方法,其特征在于,所述获取命令数据集,对所述命令数据集进行语料处理,生成句法模板与相似句对,包括:提取所述命令数据集中的命令句,利用词法分析器对所述命令句进行词法分析,生成词性特征;对所述词性特征进行排序,生成所述句法模板;提取所述命令数据集中的命令句,将命令类型相同的所述命令句两两组对,生成所述相似句对。3.根据权利要求2所述的一种相似命令文本的生成方法,其特征在于,所述将所述命令数据集与所述句法模板输入上述所述文本生成模型,生成相似命令文本,包括:基于所述命令数据集获取源句,对所述源句进行语义编码,生成源句语义隐向量;获取所述句法模板,对所述句法模板进行句法编码,生成句法隐向量;将所述语义隐向量与所述句法隐向量进行拼接,生成拼接向量;将所述拼接向量进行解码,生成所述相似命令文本。4.根据权利要求3所述的一种相似命令文本的生成方法,其特征在于,所述获取所述句法模板,对所述句法模板进行句法编码,生成句法隐向量,包括:将所述句法模板对应的所述词性特征进行编码,生成词性特征向量;对所述词性特征向量进行位置编码,生成所述句法隐向量。5.根据权利要求3所述的一种相似命令文本的生成方法,其特征在于,所述获取所述句法模板,对所述句法模板进行句法编码,生成句法隐向量,还包括:遍历所述命令数据集对应的的所述句法模板,依次对所述句法模板进行句...

【专利技术属性】
技术研发人员:罗思明
申请(专利权)人:北京探境科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1