一种滑动混合模型构建方法技术

技术编号:46626443 阅读:1 留言:0更新日期:2025-10-14 21:23
本发明专利技术公开了一种滑动混合模型构建方法,具体涉及自然语言处理和人工智能技术领域,具体步骤为:具体如下:S1、语音转文本与小模型预测;S2、Flag初步判断与输出;S3、阈值表判断与模型选择;S4、大模型提示构建与预测。本发明专利技术所述的一种滑动混合模型构建方法,旨在解决相关业务应用中效率低、准确性差和资源消耗大等问题,通过构建长尾意图阈值表、基于prompt的信息抽取分类及“先验信息+PR曲线”阈值分析等,实现快速处理长尾意图、提高多标签分类准确性和稳定模型性能。在汽车销售及售后等场景应用效果良好,为多标签分类及相关业务提供了高效智能的解决方案,有效提升用户体验和企业效益。

【技术实现步骤摘要】

本专利技术涉及自然语言处理和人工智能,特别涉及一种滑动混合模型构建方法


技术介绍

1、在自然语言处理领域,多标签分类一直是一个具有挑战性的任务。传统的自然语言处理方法,如基于词袋模型、tf-idf、n-gram等,在单标签分类中虽有一定成效,但在处理多标签分类时存在诸多局限。一方面,这些方法会忽略词语间的顺序和语法结构,导致上下文信息丢失,影响对复杂语义的理解,进而在面对多标签分类时难以准确判断文本所属的多个类别。另一方面,随着词汇表的增大,基于词频的方法容易遭遇维度灾难,使得模型训练困难,泛化能力也随之下降。此外,多标签分类中各类别之间可能存在严重的不平衡现象,传统方法难以有效应对,导致某些类别的预测精度较低。

2、近年来,预训练的大规模语言模型如bert、gpt系列等取得了显著进展。然而,在多标签分类任务中它们也面临不少问题。首先,这些大模型的训练和推理需要大量的计算资源,对于实时性和资源受限的环境并不适用。其次,在数据量相对较小或多标签分类场景下,大模型存在过度拟合的风险,在未见过的数据上泛化能力不佳。再者,多标签分类问题中的标签往往相本文档来自技高网...

【技术保护点】

1.一种滑动混合模型构建方法,其特征在于,具体如下:

2.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:对于每个意图,根据以下规则确定所述Flag值:

3.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述小模型的训练数据需涵盖不同行业、场景及用户群体的大量语音文本样本,训练过程采用动态学习率调整策略,依据训练误差实时调整学习率。

4.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述S4中,在构建具有代表性的问题-答案对时,采用语义相似度和业务相关性双重筛选标准,通过语义分析算法计算问题相似度确保多样性,依据业务规...

【技术特征摘要】

1.一种滑动混合模型构建方法,其特征在于,具体如下:

2.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:对于每个意图,根据以下规则确定所述flag值:

3.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述小模型的训练数据需涵盖不同行业、场景及用户群体的大量语音文本样本,训练过程采用动态学习率调整策略,依据训练误差实时调整学习率。

4.根据权利要求1所述的一种滑动混合模型构建方法,其特征在于:所述s4中,在构建具有代表性的问题-答案对时,采用语义相似度和业务相关性双重筛...

【专利技术属性】
技术研发人员:张丽娜刘烨
申请(专利权)人:深圳溥泉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1