【技术实现步骤摘要】
本申请涉及自然语言处理,尤其涉及一种文本分类模型的优化方法、文本分类方法及相关设备。
技术介绍
1、目前自然语言处理(natural language processing,nlp)理论研究与模型探索逐渐拓展至更为广阔的、向人类智慧愈发靠近的各个领域,涉及的问题也逐渐从分词、语义分类与匹配、问答等任务延伸,呈现出由易到难的趋势。坏样本问题是优化算法模型的关键问题。
2、相关技术中,通常基于文本特征信息以及预先建立的坏样本筛选规则,从训练数据中筛选出坏样本,然后基于坏样本的分类结果与标签之间的差异计算模型损失,进而基于模型损失调整模型参数。然而,这种方式较为粗略,并未从根本上对模型进行有针对性的优化,导致模型优化效果不佳,从而影响模型分类准确性。
技术实现思路
1、本申请实施例的目的提供一种文本分类模型的优化方法、文本分类方法及相关设备,用于实现对文本分类模型的有针对性调整,从而提高文本分类模型的分类准确性。
2、为了实现上述目的,本申请实施例采用下述技术方案:
>3、第一方面本文档来自技高网...
【技术保护点】
1.一种文本分类模型的优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,一个词向量集中包括词向量集所对应文本中各词语的词向量,每个词语的词向量包括各词语的动态词向量和静态词向量;
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个第一训练文本各自的斜率差值和所述多个第二训练文本各自的斜率差值,从所述多个第一训练文本中确定影响所述坏样本的预测类别的关键文本,包括:
4.根据权利要求2所述的方法,其特征在于,所述针对目标文本集中的各个文本,基于所述文本中各词语的动态词向量和静态词向量,确定所述文本的句斜率,
...
【技术特征摘要】
1.一种文本分类模型的优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,一个词向量集中包括词向量集所对应文本中各词语的词向量,每个词语的词向量包括各词语的动态词向量和静态词向量;
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个第一训练文本各自的斜率差值和所述多个第二训练文本各自的斜率差值,从所述多个第一训练文本中确定影响所述坏样本的预测类别的关键文本,包括:
4.根据权利要求2所述的方法,其特征在于,所述针对目标文本集中的各个文本,基于所述文本中各词语的动态词向量和静态词向量,确定所述文本的句斜率,包括:
5.根据权利要求2所述的方法,其特征在于,在针对目标文本集中的各个文本,基于所述文本中各词语的动态词向量和静态词向量,确定所述文本的句斜率之后,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述关键文本优化所述文本分类模型,以得到目标文本分类模型,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述关键文本的词向量集,对所述文本集中的训练文本进行更新,包括:
8.根据权利要...
【专利技术属性】
技术研发人员:白安琪,蒋宁,陆全,夏粉,吴海英,肖冰,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。