参数更新方法及装置、标签生成方法及装置制造方法及图纸

技术编号：40846276 阅读：4 留言：0更新日期：2024-04-01 15:14

本申请提供参数更新方法及装置、标签生成方法及装置，其中所述参数更新方法包括：获取样本文档，以及所述样本文档对应的样本标签；基于所述样本标签确定样本标签类型；根据所述样本标签类型以及初始标签生成参数确定初始标签生成子参数，并通过所述初始标签生成子参数对所述样本文档进行处理，获得至少一个预测标签；根据各个预测标签与所述样本标签对所述初始标签生成子参数进行调整，获得目标标签生成子参数；基于所述目标标签生成子参数对所述初始标签生成参数进行更新，获得标签生成参数，得到的标签生成参数省去了文档主题提取的过程，避免了调参过程困难，结果难以控制等问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理领域，特别涉及一种参数更新方法，一种标签生成方法。本申请同时涉及一种参数更新装置、一种标签生成装置、一种计算设备，以及一种计算机可读存储介质。

技术介绍

1、人工智能(artificial intelligence；ai)是指已工程化(即设计并制造)的系统感知环境的能力，以及获取、处理、应用和表示知识的能力。人工智能深度学习框架实现了对算法的封装。随着人工智能的发展，各种深度学习框架不断的涌现；tensorflow、pytorch等通用型深度学习框架，应用于自然语言处理、计算机视觉、语音处理等领域，以及机器翻译、智慧金融、智能医疗、自动驾驶等行业。是现今应用较为广泛的一种深度学习框架。

2、现有技术中，多是采用人工方法对需要进行标记的资源打上标签，除此之外采用的方法还有基于主题进行分类或是基于命名实体识别从文中抽取标签这两种方法确定标签。

3、然而，人工确定标签的方法所消耗的时间较长，消耗的人力成本也较高，不利于大量资源的标签确定；而基于主题进行分类的方法，需要使用神经网络模型对整个文本信息进行主题抽取，将相同内容的文本聚类在一起，得到一个无属性簇，再人工对这个簇进行命名得到标签，然而这种半监督方法的主题调参过程困难，结果也难以控制，尤其是在领域迁移的情况下，需要重新进行训练，工作量巨大；最后的基于命名实体从文中抽取的方法确定标签，则只能从文中抽取关键词作为标签，虽然抽取过程相对简便，但是得到的标签只能是文档中出现的词语，这种方法在面对总结性不强或是联想性较强的文档都无法实现有效的标签生

技术实现思路

1、有鉴于此，本申请实施例提供了一种参数更新方法，一种标签生成方法，以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种参数更新装置、一种标签生成装置、一种计算设备，以及一种计算机可读存储介质。

2、根据本申请实施例的第一方面，提供了一种参数更新方法，包括：

3、获取样本文档，以及所述样本文档对应的样本标签；

4、基于所述样本标签确定样本标签类型；

5、根据所述样本标签类型以及初始标签生成参数确定初始标签生成子参数，并通过所述初始标签生成子参数对所述样本文档进行处理，获得至少一个预测标签；

6、根据各个预测标签与所述样本标签对所述初始标签生成子参数进行调整，获得目标标签生成子参数；

7、基于所述目标标签生成子参数对所述初始标签生成参数进行更新，获得标签生成参数。

8、根据本申请实施例的第二方面，提供了一种标签生成方法，包括：

9、获取待处理文档，并输入至标签生成模型；

10、通过所述标签生成模型中的各个目标标签生成子模型对所述待处理文档进行处理，获得各个目标标签生成子模型输出的各个文档标签子集合；

11、计算各个文档标签子集合中的文档标签与关联的子标签标识的匹配度；

12、根据匹配度计算结果确定目标标签，并通过所述标签生成模型进行输出。

13、根据本申请实施例的第三方面，提供了一种参数更新装置，包括：

14、获取模块，被配置为获取样本文档，以及所述样本文档对应的样本标签；

15、确定模块，被配置为基于所述样本标签确定样本标签类型；

16、生成模块，被配置为根据所述样本标签类型以及初始标签生成参数确定初始标签生成子参数，并通过所述初始标签生成子参数对所述样本文档进行处理，获得至少一个预测标签；

17、调整模块，被配置为根据各个预测标签与所述样本标签对所述初始标签生成子参数进行调整，获得目标标签生成子参数；

18、更新模块，被配置为基于所述目标标签生成子参数对所述初始标签生成参数进行更新，获得标签生成参数。

19、根据本申请实施例的第四方面，提供了一种标签生成装置，包括：

20、输入模型，被配置为获取待处理文档，并输入标签生成模型；

21、处理模块，被配置为通过所述标签生成模型中的各个目标标签生成子模型对所述待处理文档进行处理，获得各个目标标签生成子模型输出的各个文档标签子集合；

22、计算模块，被配置为计算各个文档标签子集合中的文档标签与关联的子标签标识的匹配度；

23、输出模块，被配置为根据匹配度计算结果确定目标标签，并通过所述标签生成模型进行输出。

24、根据本申请实施例的第五方面，提供了一种计算设备，包括：

25、存储器和处理器；

26、所述存储器用于存储计算机可执行指令，所述处理器执行所述计算机可执行指令时实现所述参数更新方法与所述标签生成方法的步骤。

27、根据本申请实施例的第六方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现所述参数更新方法与所述标签生成方法的步骤。

28、根据本申请实施例的第七方面，提供了一种芯片，其存储有计算机程序，该计算机程序被芯片执行时实现所述参数更新方法与所述标签生成方法的步骤。

29、本申请提供的参数更新方法，通过使用样本文档以及样本文档对应的样本标签进行模型训练，得到一个能够对特定种类的文档进行标签预测的目标标签生成子模型，之后基于该子模型对标签生成模型进行更新，通过这种方法可以使得标签生成模型中具备多个子模型，每个子模型可以将对应种类文档的标签进行预测，并且通过这种方式，将文档与标签进行直接的关联，无需文档主题的提取过程，并且在领域迁移的情况下，只需要增加新的子模型，而无需重新训练标签生成模型，节省资源与时间成本。

30、本申请提供的标签生成方法，通过将获取的待处理文档输入标签生成模型，通过标签生成模型中的各个目标标签生成子模型对所述待处理文档进行处理，得到文档标签子集合，之后计算子集合中的文档标签与目标标签子模型的子标签标识之间的匹配度，通过匹配度对生成的文档标签进行筛选，得到目标标签，通过这种方式使待处理文档通过各个目标标签生成子模型的处理，得到标签集合，由于不同种类的文档对应了不同种类的目标标签生成子模型，这种方法有效的保证了文档被处理的准确性。

本文档来自技高网...

【技术保护点】

1.一种参数更新方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述样本标签类型以及初始标签生成参数确定初始标签生成子参数，并通过所述初始标签生成子参数对所述样本文档进行处理，获得至少一个预测标签，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述样本标签标识以及初始标签生成模型确定初始标签生成子模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据计算结果确定所述初始标签生成子模型，包括：

5.根据权利要求4所述的方法，其特征在于，在各个子标签标识与所述样本标签类型的相似度都没有超过相似阈值的情况下，还包括：

6.根据权利要求2所述的方法，其特征在于，所述基于所述目标标签生成子模型对所述初始标签生成模型进行更新，得到标签生成模型，包括：

7.根据权利要求1所述的方法，其特征在于，所述获取样本文档，以及所述样本文档对应的样本标签，包括：

8.根据权利要求3所述的方法，其特征在于，所述根据各个预测标签与所述样本标签对所述初始标签生成子模型进行调参，包括：

9.一种标签生成方法，其特征在于，包括：

10.根据权利要求9所述的方法，其特征在于，所述计算各个文档标签子集合中的文档标签与关联子标签标识的匹配度，包括：

11.根据权利要求9所述的方法，其特征在于，所述根据匹配度计算结果确定目标标签，包括：

12.一种参数更新装置，其特征在于，包括：

13.一种标签生成装置，其特征在于，包括：

14.一种计算设备，其特征在于，包括：

15.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该指令被处理器执行时实现权利要求1至8任意一项所述参数更新方法的步骤与权利要求9至11任意一项所述标签生成方法的步骤。

...

【技术特征摘要】

1.一种参数更新方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述样本标签标识以及初始标签生成模型确定初始标签生成子模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据计算结果确定所述初始标签生成子模型，包括：

5.根据权利要求4所述的方法，其特征在于，在各个子标签标识与所述样本标签类型的相似度都没有超过相似阈值的情况下，还包括：

6.根据权利要求2所述的方法，其特征在于，所述基于所述目标标签生成子模型对所述初始标签生成模型进行更新，得到标签生成模型，包括：

7.根据权利要求1所述的方法，其特征在于，所述获取...

【专利技术属性】
技术研发人员：李小龙，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人