【技术实现步骤摘要】
本专利技术涉及车机意图识别领域,更具体地,涉及一种基于远程监督算法增强大语言模型多标签意图的分类方法。
技术介绍
1、传统车机对于车主用车意图识别依赖于供应商提供的词汇库与固定规则模板进行解析,该方式通常只能识别预设的固定指令,对于非标准表达往往无法正确理解;同时缺乏上下文理解能力,无法根据对话的连续性和环境变化准确识别车主多种用车意图。近年来,随着车载娱乐车机的智能化发展,智能化车机语义理解技术实现了车主通过语音方式进行人机对话。结合自然语言处理技术,智能化车机能够从对话中进行意图识别,生成指令快速完成车辆控制。但受限于车主语言表达的多样性与多意图标签分类算法训练数据标注难度大的限制,意图识别算法仍无法有效识别车主多种意图。基于自然语言处理技术的用车多意图识别、意图强弱排序等智能车机语义理解能力仍需要提升。
2、远程监督算法(distant supervision)是一种半监督学习算法,其基本假设是对于一个已有的数据集中的三元组(由一对实体和一个关系构成),外部未标注数据中任何包含这对实体的句子在一定程度上都反映了这种关系
...【技术保护点】
1.一种基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,
2.根据权利要求1所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的种子标注数据集具体通过以下方式得到:
3.根据权利要求1所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的大语言模型微调训练集具体通过以下方式得到:
4.根据权利要求1所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的使用LoRA方法对大语言模型进行微调具体为:
5.根据权利要求2所述的基于远程监督算法增
...【技术特征摘要】
1.一种基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,
2.根据权利要求1所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的种子标注数据集具体通过以下方式得到:
3.根据权利要求1所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的大语言模型微调训练集具体通过以下方式得到:
4.根据权利要求1所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的使用lora方法对大语言模型进行微调具体为:
5.根据权利要求2所述的基于远程监督算法增强大语言模型多标签意图的分类方法,其特征在于,所述的数据清洗的规则为:
6.根据权利要...
【专利技术属性】
技术研发人员:熊鹰飞,吕承杰,余繁荣,李玉明,许朋涛,
申请(专利权)人:东风汽车集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。