文本分类模型的优化方法、文本分类方法及相关设备技术

技术编号:40317672 阅读:21 留言:0更新日期:2024-02-07 21:00
本申请公开了一种文本分类模型的优化方法、文本分类方法及相关设备。所述文本分类模型的优化方法包括:获取文本集中各文本的词向量集以及文本集中的坏样本,文本分类模型为基于文本集中的训练文本和训练文本的类别标签进行训练得到;基于坏样本的预测类别和类别标签,从文本集中选取多个第一训练文本和多个第二训练文本,第一训练文本的类别标签与坏样本的类别标签相同,第二训练文本的类别标签与坏样本的预测类别相同;基于坏样本的词向量集、多个第一训练文本各自的词向量集以及多个第二训练文本各自的词向量集,从多个第一训练文本中确定影响坏样本的预测类别的关键文本;基于关键文本优化文本分类模型,以得到目标文本分类模型。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种文本分类模型的优化方法、文本分类方法及相关设备


技术介绍

1、目前自然语言处理(natural language processing,nlp)理论研究与模型探索逐渐拓展至更为广阔的、向人类智慧愈发靠近的各个领域,涉及的问题也逐渐从分词、语义分类与匹配、问答等任务延伸,呈现出由易到难的趋势。坏样本问题是优化算法模型的关键问题。

2、相关技术中,通常基于文本特征信息以及预先建立的坏样本筛选规则,从训练数据中筛选出坏样本,然后基于坏样本的分类结果与标签之间的差异计算模型损失,进而基于模型损失调整模型参数。然而,这种方式较为粗略,并未从根本上对模型进行有针对性的优化,导致模型优化效果不佳,从而影响模型分类准确性。


技术实现思路

1、本申请实施例的目的提供一种文本分类模型的优化方法、文本分类方法及相关设备,用于实现对文本分类模型的有针对性调整,从而提高文本分类模型的分类准确性。

2、为了实现上述目的,本申请实施例采用下述技术方案:>

3、第一方面本文档来自技高网...

【技术保护点】

1.一种文本分类模型的优化方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,一个词向量集中包括词向量集所对应文本中各词语的词向量,每个词语的词向量包括各词语的动态词向量和静态词向量;

3.根据权利要求2所述的方法,其特征在于,所述基于所述多个第一训练文本各自的斜率差值和所述多个第二训练文本各自的斜率差值,从所述多个第一训练文本中确定影响所述坏样本的预测类别的关键文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述针对目标文本集中的各个文本,基于所述文本中各词语的动态词向量和静态词向量,确定所述文本的句斜率,包括:

...

【技术特征摘要】

1.一种文本分类模型的优化方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,一个词向量集中包括词向量集所对应文本中各词语的词向量,每个词语的词向量包括各词语的动态词向量和静态词向量;

3.根据权利要求2所述的方法,其特征在于,所述基于所述多个第一训练文本各自的斜率差值和所述多个第二训练文本各自的斜率差值,从所述多个第一训练文本中确定影响所述坏样本的预测类别的关键文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述针对目标文本集中的各个文本,基于所述文本中各词语的动态词向量和静态词向量,确定所述文本的句斜率,包括:

5.根据权利要求2所述的方法,其特征在于,在针对目标文本集中的各个文本,基于所述文本中各词语的动态词向量和静态词向量,确定所述文本的句斜率之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述关键文本优化所述文本分类模型,以得到目标文本分类模型,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述关键文本的词向量集,对所述文本集中的训练文本进行更新,包括:

8.根据权利要...

【专利技术属性】
技术研发人员:白安琪蒋宁陆全夏粉吴海英肖冰
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1