模型训练方法、品牌词识别方法、装置及电子设备制造方法及图纸

技术编号：30099577 阅读：15 留言：0更新日期：2021-09-18 09:04

本公开提供了一种模型训练方法、品牌词识别方法、装置及电子设备，涉及人工智能技术领域，尤其涉及自然语言处理技术领域。该方法包括：采用第一内容样本对第一知识增强语义表示模型进行训练得到第一品牌词识别模型；将第一品牌词识别模型作为知识蒸馏中的教师模型，将第二知识增强语义表示模型作为知识蒸馏中的学生模型，采用知识蒸馏的方法对第二知识增强语义表示模型进行训练，得到第二品牌词识别模型，第二品牌词识别模型的输出和第一品牌词识别模型的输出一致，第二知识增强语义表示模型的模型参数少于第一知识增强语义表示模型的模型参数。提高了品牌词识别的准确率。提高了品牌词识别的准确率。提高了品牌词识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、品牌词识别方法、装置及电子设备

[0001]本公开涉及人工智能
中的自然语言处理技术，尤其涉及一种模型训练方法、品牌词识别方法、装置及电子设备。

技术介绍

[0002]内容投放者在互联网平台上投放内容时，往往会在内容中增加一些品牌词来达到引流的目的，然而有些情况下，内容投放者会在内容中增加未经授权的品牌词，这种行为是需要限制的侵权行为。为了降低侵权风险，平台需要在内容投放之前对其中的品牌词进行识别，以便于进一步审核是否侵权。
[0003]目前，相关技术中的品牌词识别方法通常是预先人工收集并整理品牌词，将收集的品牌词添加到品牌词库中,内容投放者提供待投放内容时，将待投放内容与品牌词库进行匹配，从而识别待投放内容中的品牌词。
[0004]然而，这种方法依赖于预先收集的品牌词库，准确率较低。

技术实现思路

[0005]本公开提供了一种提高了识别准确率的模型训练方法、品牌词识别方法、装置及电子设备。
[0006]根据本公开的一方面，提供了一种模型训练方法，所述方法包括：
[0007]采用第一内容样本对第一知识增强语义表示模型进行训练得到第一品牌词识别模型，所述第一品牌词识别模型的输出为所述第一内容样本中每个字的品牌词属性，所述品牌词属性为品牌词起始字、品牌词中间或结尾字、或非品牌词；
[0008]将所述第一品牌词识别模型作为知识蒸馏中的教师模型，将第二知识增强语义表示模型作为知识蒸馏中的学生模型，采用知识蒸馏的方法对所述第二知识增强语义表示模型进行训

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，所述方法包括：采用第一内容样本对第一知识增强语义表示模型进行训练得到第一品牌词识别模型，所述第一品牌词识别模型的输出为所述第一内容样本中每个字的品牌词属性，所述品牌词属性为品牌词起始字、品牌词中间或结尾字、或非品牌词；将所述第一品牌词识别模型作为知识蒸馏中的教师模型，将第二知识增强语义表示模型作为知识蒸馏中的学生模型，采用知识蒸馏的方法对所述第二知识增强语义表示模型进行训练，得到第二品牌词识别模型，所述第二品牌词识别模型的输出和所述第一品牌词识别模型的输出一致，所述第二知识增强语义表示模型的模型参数少于所述第一知识增强语义表示模型的模型参数。2.根据权利要求1所述的方法，其中，所述采用知识蒸馏的方法对所述第二知识增强语义表示模型进行训练，得到第二品牌词识别模型，包括：将内容样本分别输入至所述第一品牌词识别模型和所述第二知识增强语义表示模型，并根据所述第一品牌词识别模型和所述第二知识增强语义表示模型之间的损失函数，对所述第二知识增强语义表示模型的模型参数进行更新，得到所述第二品牌词识别模型。3.根据权利要求2所述的方法，其中，所述内容样本包括第二内容样本和第三内容样本，所述损失函数包括第一损失函数和第二损失函数；所述将内容样本分别输入至所述第一品牌词识别模型和所述第二知识增强语义表示模型，并根据所述第一品牌词识别模型和所述第二知识增强语义表示模型之间的损失函数，对所述第二知识增强语义表示模型的模型参数进行更新，得到所述第二品牌词识别模型，包括：将所述第二内容样本分别输入至所述第一品牌词识别模型和所述第二知识增强语义表示模型，根据所述第二知识增强语义表示模型的中间层的输出与所述第一品牌词识别模型的中间层的输出之间的所述第一损失函数，对所述第二知识增强语义表示模型的模型参数进行更新，得到初始品牌词识别模型；将所述第三内容样本分别输入至所述第一品牌词识别模型和所述初始品牌词识别模型，根据所述第一品牌词识别模型的输出、所述初始品牌词识别模型的输出以及第三内容样本的真实品牌标签的所述第二损失函数，对所述初始品牌词识别模型的模型参数进行更新，得到所述第二品牌词识别模型。4.根据权利要求3所述的方法，其中，所述第二知识增强语义表示模型的中间层的层数为M，所述第一品牌词识别模型的中间层的层数是n*M，M为大于或等于1的整数，n为大于1的整数；所述第一损失函数为所述第二知识增强语义表示模型的第m层中间层的输出，与所述第一品牌词识别模型的第n*m层中间层的输出之间的均方误差损失在m的取值遍历1至M之间的整数时的和。5.根据权利要求3所述的方法，其中，所述第二损失函数为所述第一品牌词识别模型的输出与所述初始品牌词识别模型的输出之间的交叉熵损失，以及所述初始品牌词识别模型的输出与所述第三内容样本的真实品牌标签之间的交叉熵损失的和。6.一种品牌词识别方法，所述方法包括：将待识别内容输入品牌词识别模型，得到所述待识别内容中每个字的品牌词属性，所
述品牌词属性为品牌词起始字、品牌词中间或结尾字、或非品牌词，所述品牌词识别模型为采用权利要求1
‑
5中任一项所述的方法训练得到的品牌词识别模型；根据所述待识别内容中每个字的品牌词属性确定所述待识别内容中的品牌词。7.根据权利要求6所述的方法，其中，所述根据所述待识别内容中每个字的品牌词属性确定所述待识别内容中的品牌词，包括：按照所述待识别内容中每个字的顺序，将品牌词属性为品牌词起始字的字以及品牌词属性为品牌词中间或结尾字的字依次组合为所述待识别内容中的品牌词。8.一种模型训练装置，所述装置包括：第一训练模块，用于采用第一内容样本对第一知识增强语义表示模型进行训练得到第一品牌词识别模型，所述第一品牌词识别模型的输出为所述第一内容样本中每个字的品牌词属性，所述品牌词属性为品牌词起...

【专利技术属性】
技术研发人员：常晓静，徐明，叶敏，党金明，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人