基于深度学习模型的语义分析方法、装置及存储介质制造方法及图纸

技术编号：31238674 阅读：24 留言：0更新日期：2021-12-08 10:25

本发明专利技术涉及一种基于深度学习模型的语义分析方法及装置，该方法包括：从深度学习模型的训练文本数据中提取字向量；获取经训练的固定词向量；根据自定义规则修改固定词向量，包括为至少一个固定词向量增加至少一个特征标记形成特征词向量，每个特征标记用于标记固定词向量的一种分类；设置字向量的维度等于特征词向量的维度；采用字向量和特征词向量训练深度学习模型获得预测模型，其中，设置特征词向量在训练过程中不可被修改；根据自定义规则修改预输入至预测模型的新词向量，形成新特征词向量，并将新特征词向量输入预测模型。本发明专利技术实现了模型与知识的有机结合。实现了模型与知识的有机结合。实现了模型与知识的有机结合。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习模型的语义分析方法、装置及存储介质

[0001]本专利技术主要涉及计算机
，具体地涉及一种基于深度学习模型的语义方法、装置及存储介质。

技术介绍

[0002]在车载语音对话中，车机的语音系统需要根据用户的语音来识别用户的意图。例如，说“播放爱我中华”，该句子对应的分类是“音乐”，所要执行的动作是“播放”，所要播放的内容是歌曲“爱我中华”；说“导航到全聚德”，该句子对应的分类是“地图导航”，所要执行的动作是“导航”，所要到达的终点是“全聚德”等。当人听到这些句子时，可以根据已有的知识很快得知该句子的含义。但是对于机器来说，其本身并不具备这些知识，想要从一句语句中获得用户的意图，需要通过大量的数据进行训练和学习，才能获得正确的分类结果或识别结果。目前，在车载语音对话的识别中，可以采用深度学习模型来进行语义的分析，以获知用户的意图，并执行相应的命令。
[0003]由于深度学习模型是数据驱动的，模型的训练依赖于大量的数据和数据集。在实际应用中，除了数据集之外，经常有一些知识需要模型去学习，如专有名词等。在这种情况下，一般的做法是将这些知识人为的做成文本数据，或者收集包含这些知识的数据，然后再将这些数据增加到训练数据集中，重新进行模型训练和部署。然而，收集包含知识数据的方式效率低、成本高，而且有些相对特殊的数据本身就少，收集难度很大。如果使用人为制造的数据往往会破坏数据集本身的概率分布，同时人为制造的数据样本也不够丰富，容易导致模型过拟合等问题。所以，现有的做法不能有效的将知识与模型结合起来。
>
技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种基于深度学习模型的语义分析方法、装置及存储介质，使知识有机地结合在模型中。
[0005]本专利技术提供一种深度学习模型的控制方法，所述方法包括：从深度学习模型的训练文本数据中提取字向量；获取经训练的固定词向量；根据自定义规则修改所述固定词向量，包括为至少一个所述固定词向量增加至少一个特征标记形成特征词向量，每个所述特征标记用于标记所述固定词向量的一种分类；设置所述字向量的维度等于所述特征词向量的维度；采用所述字向量和所述特征词向量训练所述深度学习模型获得预测模型，其中，设置所述特征词向量在训练过程中不可被修改；以及根据所述自定义规则修改预输入至所述预测模型的新词向量，形成新特征词向量，并将所述新特征词向量输入所述预测模型。
[0006]在本专利技术的一实施例中，根据自定义规则修改所述固定词向量的步骤包括：为每个所述固定词向量增加预定数量的新增维度，每个所述新增维度对应一个所述特征标记；设置每个所述新增维度的初始值为0；以及为每个所述固定词向量设置每个所述新增维度的特征值，所述特征值对应于所述固定词向量根据所述特征标记的分类结果。
[0007]在本专利技术的一实施例中，所述特征词向量的维度是2的N次方，N为正整数。
[0008]在本专利技术的一实施例中，设置所述特征词向量在训练过程中不可被修改的步骤包括：使所述特征词向量在所述训练过程中不参与反向传播。
[0009]在本专利技术的一实施例中，所述训练文本数据包括人机对话中的对话语料。
[0010]在本专利技术的一实施例中，所述对话语料包括句子，从深度学习模型的训练文本数据中提取字向量的步骤包括：对所述句子进行分字处理，通过随机初始化获得所述字向量。
[0011]在本专利技术的一实施例中，在设置所述字向量的维度等于所述特征词向量的维度的步骤之后还包括：堆叠所述字向量和所述特征词向量，使所述字向量和所述特征词向量合并为一个训练数据集。
[0012]在本专利技术的一实施例中，所述深度学习模型是意图识别模型。
[0013]本专利技术为解决上述技术问题还提供一种基于深度学习模型的语义分析装置，所述装置包括：存储器，用于存储可由处理器执行的指令；处理器，用于执行所述指令以实现上述方法。
[0014]本专利技术为解决上述技术问题还提供一种存储有计算机程序代码的计算机可读介质，所述计算机程序代码在由处理器执行时实现上述方法。
[0015]本专利技术的技术方案相比现有技术的有益效果如下：
[0016]本专利技术通过自定义规则在经训练的词向量中加入增加预定数量的新增维度，将知识作为特征输入到模型中，不用转换成数据之后再让模型学习，效率高、成本低、可解释性强，实现模型与知识的有机结合。根据自定义规则增加或修改固定词向量的特征标记，可以增加或者修改词对应的意义，可以实现对模型的控制。
附图说明
[0017]为让本专利技术的上述目的、特征和优点能更明显易懂，以下结合附图对本专利技术的具体实施方式作详细说明，其中：
[0018]图1是本专利技术一实施例的基于深度学习模型的语义分析方法的示例性流程示意图；
[0019]图2是本专利技术一实施例的语义分析方法中根据自定义规则修改固定词向量的示例性流程示意图；
[0020]图3是本专利技术一实施例的深度学习模型的训练过程示意图；
[0021]图4是本专利技术一实施例的基于深度学习模型的语义分析装置的系统框图。
具体实施方式
[0022]为让本专利技术的上述目的、特征和优点能更明显易懂，以下结合附图对本专利技术的具体实施方式作详细说明。
[0023]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术，但是本专利技术还可以采用其它不同于在此描述的其它方式来实施，因此本专利技术不受下面公开的具体实施例的限制。
[0024]如本申请和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备
也可能包含其他的步骤或元素。
[0025]除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。
[0026]此外，尽管本申请中所使用的术语是从公知公用的术语中选择的，但是本申请说明书中所提及的一些术语可能是申请人按他或她的判断来选择的，其详细含义在本文的描述的相关部分中说明。此外，要求不仅仅通过所使用的实际术语，而是还要通过每个术语所蕴含的意义来理解本申请。
[0027]本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是，前面或下面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习模型的语义分析方法，其特征在于，包括：从深度学习模型的训练文本数据中提取字向量；获取经训练的固定词向量；根据自定义规则修改所述固定词向量，包括为至少一个所述固定词向量增加至少一个特征标记形成特征词向量，每个所述特征标记用于标记所述固定词向量的一种分类；设置所述字向量的维度等于所述特征词向量的维度；采用所述字向量和所述特征词向量训练所述深度学习模型获得预测模型，其中，设置所述特征词向量在训练过程中不可被修改；以及根据所述自定义规则修改预输入至所述预测模型的新词向量，形成新特征词向量，并将所述新特征词向量输入所述预测模型。2.如权利要求1所述的语义分析方法，其特征在于，根据自定义规则修改所述固定词向量的步骤包括：为每个所述固定词向量增加预定数量的新增维度，每个所述新增维度对应一个所述特征标记；设置每个所述新增维度的初始值为0；以及为每个所述固定词向量设置每个所述新增维度的特征值，所述特征值对应于所述固定词向量根据所述特征标记的分类结果。3.如权利要求1所述的语义分析方法，其特征在于，所述特征词向量的维度是2的N次方，N为正整数。4.如权利要求1所述的语义分析方法...

【专利技术属性】
技术研发人员：王章定，朱亚杰，王波，魏德山，马伯睿，
申请(专利权)人：合众新能源汽车有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人