【技术实现步骤摘要】
本专利技术涉及自然语言处理和人工智能,特别涉及一种滑动混合模型构建方法。
技术介绍
1、在自然语言处理领域,多标签分类一直是一个具有挑战性的任务。传统的自然语言处理方法,如基于词袋模型、tf-idf、n-gram等,在单标签分类中虽有一定成效,但在处理多标签分类时存在诸多局限。一方面,这些方法会忽略词语间的顺序和语法结构,导致上下文信息丢失,影响对复杂语义的理解,进而在面对多标签分类时难以准确判断文本所属的多个类别。另一方面,随着词汇表的增大,基于词频的方法容易遭遇维度灾难,使得模型训练困难,泛化能力也随之下降。此外,多标签分类中各类别之间可能存在严重的不平衡现象,传统方法难以有效应对,导致某些类别的预测精度较低。
2、近年来,预训练的大规模语言模型如bert、gpt系列等取得了显著进展。然而,在多标签分类任务中它们也面临不少问题。首先,这些大模型的训练和推理需要大量的计算资源,对于实时性和资源受限的环境并不适用。其次,在数据量相对较小或多标签分类场景下,大模型存在过度拟合的风险,在未见过的数据上泛化能力不佳。再者,多标签分
...【技术保护点】
1.一种滑动混合模型构建方法,其特征在于,具体如下:
2.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:对于每个意图,根据以下规则确定所述Flag值:
3.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述小模型的训练数据需涵盖不同行业、场景及用户群体的大量语音文本样本,训练过程采用动态学习率调整策略,依据训练误差实时调整学习率。
4.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述S4中,在构建具有代表性的问题-答案对时,采用语义相似度和业务相关性双重筛选标准,通过语义分析算法计算问题相似度确
...【技术特征摘要】
1.一种滑动混合模型构建方法,其特征在于,具体如下:
2.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:对于每个意图,根据以下规则确定所述flag值:
3.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述小模型的训练数据需涵盖不同行业、场景及用户群体的大量语音文本样本,训练过程采用动态学习率调整策略,依据训练误差实时调整学习率。
4.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述s4中,在构建具有代表性的问题-答案对时,采用语义相似度和业务相关性双重筛...
【专利技术属性】
技术研发人员:张丽娜,刘烨,
申请(专利权)人:深圳溥泉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。