关键词检测模型的训练方法、关键词检测方法及装置制造方法及图纸

技术编号:42808744 阅读:10 留言:0更新日期:2024-09-24 20:51
本申请公开了一种关键词检测模型的训练方法、关键词检测方法及装置,涉及计算机技术领域。所述方法包括:获取关键词检测模型的训练样本集;采用训练样本集对关键词检测模型进行训练,得到经初步训练的关键词检测模型;对经初步训练的关键词检测模型的模型参数进行压缩,得到压缩后的关键词检测模型;采用训练样本集对压缩后的关键词检测模型进行训练,得到完成训练的关键词检测模型;将完成训练的关键词检测模型的特征提取部分发送给终端设备。本申请通过对经初步训练的关键词检测模型的模型参数进行压缩,充分减小了最终得到的关键词检测模型的数据体量,避免关键词检测模型对终端设备的运行造成负担。

【技术实现步骤摘要】

本申请涉及计算机,特别涉及一种关键词检测模型的训练方法、关键词检测方法及装置


技术介绍

1、关键词检测(keyword spotting,kws)是指对待检测文本进行关键词识别,即从待检测文本中检测指定词语的出现位置。

2、相关技术中,识别文本关键词时可以建模为自然语言处理(natural languageprocessing,nlp)中的命名实体识别(named entity recognition,ner)模型,将待识别的关键词作为命名实体,其余词汇均作为背景词汇,将识别关键词的任务转化为序列标注任务,从而识别出文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。

3、然而,上述方法采用的模型较为复杂,模型对应的存储量较大,运用于诸如手机等终端设备中容易导致终端设备的运行负担过重。


技术实现思路

1、本申请实施例提供了一种关键词检测模型的训练方法、关键词检测方法及装置。所述技术方案如下:

2、根据本申请实施例的一个方面,提供了一种关键词检测模型的训练方法本文档来自技高网...

【技术保护点】

1.一种关键词检测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述经初步训练的关键词检测模型的模型参数进行压缩,得到压缩后的关键词检测模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述对角矩阵包含的奇异值中,选择满足第一条件的目标奇异值,包括:

4.根据权利要求2所述的方法,其特征在于,所述第一神经网络层的参数矩阵包括m×n个参数,所述第一正交矩阵包括m×m个参数,所述对角矩阵包括m×n个参数,所述第二正交矩阵包括n×n个参数,所述目标奇异值的数量为r,m、n、r均为大于1的整数;

...

【技术特征摘要】

1.一种关键词检测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述经初步训练的关键词检测模型的模型参数进行压缩,得到压缩后的关键词检测模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述对角矩阵包含的奇异值中,选择满足第一条件的目标奇异值,包括:

4.根据权利要求2所述的方法,其特征在于,所述第一神经网络层的参数矩阵包括m×n个参数,所述第一正交矩阵包括m×m个参数,所述对角矩阵包括m×n个参数,所述第二正交矩阵包括n×n个参数,所述目标奇异值的数量为r,m、n、r均为大于1的整数;

5.根据权利要求1所述的方法,其特征在于,所述获取所述关键词检测模型的训练样本集,包括:

6.根据权利要求1所述的方法,其特征在于,所述关键词检测模型的输入数据的最大长度为l,l为正整数;

7.根据权利要求6所述的方法,其特征在于,所述剔除所述训练样本的文本中包含的非关键字符,得到所述训练样本的缩减文本,包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述采用所述训练样本集对所述压缩后的关键词检测模型进行训练,得到完成训练的关键词检测模型之后,还包括:

10.一种关键词检测方法,其特征在于,所述方法包括:

11.根据权利要求10所述的方法,其特...

【专利技术属性】
技术研发人员:翟彬旭
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1