【技术实现步骤摘要】
一种文本分类模型优化方法和装置
[0001]本专利技术涉及深度学习领域,尤其涉及一种文本分类模型优化方法和装置。
技术介绍
[0002]在深度学习的模型训练领域,往往需要利用训练样本对模型进行训练,使训练完成的模型能对待识别内容执行分类识别。在实际应用中,识别需求多种多样,针对多种识别任务,往往需要利用多个模型从不同方面对待识别内容执行分类识别。而采用多个模型分别执行识别,虽然能够得到识别结果,但由于多个模型的总量庞大,所以执行识别分类所需的时间长,识别效率比较低。
[0003]而且,在样本偏差大、样本数据稀疏的情况下,由于训练样本不足,往往导致模型识别准确率差的问题。
[0004]如何提高模型的多任务识别效率,是本申请所要解决的技术问题。
技术实现思路
[0005]本申请实施例的目的是提供一种文本分类模型优化方法和装置,用以解决模型的多任务识别效率低的问题。
[0006]第一方面,提供了一种文本分类模型优化方法,包括:
[0007]获取文本分类模型的训练样本,所述训练样本包括 ...
【技术保护点】
【技术特征摘要】
1.一种文本分类模型优化方法,其特征在于,包括:获取文本分类模型的训练样本,所述训练样本包括多条样本语句和对应样本语句的样本标签,所述训练样本中的样本标签包括敏感词标签、情感标签和语义标签,其中,任一样本语句对应至少一种样本标签;将所述多条样本语句和对应的样本标签输入所述文本分类模型的特征抽取层进行特征抽取,得到分别对应各条样本语句的特征向量,所述特征向量表征对应的样本语句在敏感词维度、情感维度和语义维度中的至少一种特征维度上的特征值;将所述样本语句的特征向量输入所述文本分类模型的多个分类器中处理,得到所述样本语句的特征向量对应的分类标签,所述文本分类模型包括敏感词分类器、情感分类器和语义分类器,所述每一条样本语句的分类标签包括敏感词标签、情感标签和语义标签中的至少一种;根据所述样本语句对应的分类标签和所述样本标签优化所述文本分类模型。2.如权利要求1所述的方法,其特征在于,根据所述样本语句对应的分类标签和所述样本标签优化所述文本分类模型,包括:根据每一条样本语句对应的分类标签和样本标签确定所述文本分类模型的损失函数;根据所述损失函数优化所述文本分类模型。3.如权利要求2所述的方法,其特征在于,根据每一条样本语句对应的分类标签和样本标签确定所述文本分类模型的损失函数,包括:根据每一条样本语句对应的分类标签和样本标签分别确定对应各个分类器的损失函数;根据预设权重系数,将对应各个分类器的损失函数的加权和确定为所述文本分类模型的损失函数。4.如权利要求1所述的方法,其特征在于,将所述样本语句的特征向量输入所述文本分类模型的多个分类器中处理,得到所述样本语句的特征向量对应的分类标签,所述文本分类模型包括敏感词分类器、情感分类器和语义分类器,包括:将所述样本语句的特征向量输入所述敏感词分类器处理,得到所述敏感词分类器根据敏感词隐向量输出的敏感词标签,所述敏感词隐向量由敏感词解码器对所述特征抽取层输出的隐藏状态解码得到;将所述样本语句的特征向量输入所述情感分类器处理,得到所述情感分类器根据情感隐向量输出的情感标签,所述情感隐向量由情感解码器对所述特征抽取层输出的隐藏状态解码得到;将所述样本语句的特征向量输入所述语义分类器处理,得到所述语义分类器根据语义隐向量输出的语义标签,所述语义隐向量由语义解码器对所述特征抽取层输出的隐藏状态解码得到。5.如权利要求1所述的方法,其特征在于,所述训练样本中的样本标签还包括预设话术标签,所述特征向量还表征对应的样本语句在预设话术维度的特征值,所述预设话术维度的特征值表征所述样本语句是否包括预设话术内容,所述文本分类模型还包括预设话术分类器;其中,将所述样本语句的特征向量输入所述文本分类模型的多个分类器中处理,得到
所述样本语句的特征向量对应...
【专利技术属性】
技术研发人员:曹磊,蒋宁,王洪斌,吴海英,李长林,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。