【技术实现步骤摘要】
本专利技术属于电力数据处理,特别涉及基于大模型的多模态数据库动态融合优化方法及系统。
技术介绍
1、在电力文本数据处理
,随着电力行业数字化进程加速,对电力文本数据的高效处理需求愈发迫切。现有电力文本数据库暴露出诸多亟待解决的问题。
2、电力领域数据具有多源性,涵盖文本、图像、数值等多种形式,且呈现异构性。然而,当前技术大多采用独立的处理模块分别应对不同模态数据,缺乏统一的语义对齐机制。这使得不同类型数据间难以实现有效整合与协同处理,极大限制了对电力数据的全面挖掘与利用。
3、在电力数据清洗环节,当前主要依靠规则引擎或简单机器学习模型。但这些方法难以处理领域专业术语的歧义问题。同时,对于日志中的冗余记录等噪声数据,识别精度有限。人工制定规则耗时费力,面对海量且复杂多变的电力数据,难以高效、准确地完成清洗任务,极大增加了人力成本与时间成本。
4、综上所述,现有电力文本数据库在数据清洗及模态融合等方面的缺陷,严重制约了电力数据处理效能。
技术实现思路
...
【技术保护点】
1.基于大模型的多模态数据库动态融合优化方法,其特征在于,包括:
2.根据权利要求1所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述基于大语言模型对电力多模态数据进行清洗,得到清洗后的电力多模态数据,包括:
3.根据权利要求2所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,在数据清洗时,通过挖掘错误模式更新清洗规则,利用清洗后的数据微调大模型,对清洗结果进行置信度评分,低置信度数据推送人工复核,复核结果反馈至知识库。
4.根据权利要求1所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述基于清
...【技术特征摘要】
1.基于大模型的多模态数据库动态融合优化方法,其特征在于,包括:
2.根据权利要求1所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述基于大语言模型对电力多模态数据进行清洗,得到清洗后的电力多模态数据,包括:
3.根据权利要求2所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,在数据清洗时,通过挖掘错误模式更新清洗规则,利用清洗后的数据微调大模型,对清洗结果进行置信度评分,低置信度数据推送人工复核,复核结果反馈至知识库。
4.根据权利要求1所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述基于清洗后的电力多模态数据,进行跨模态特征提取,得到各模态的特征,包括:
5.根据权利要求4所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述通过跨模态对齐损失函数将各模态的特征进行对齐,包括:
6.根据权利要求1所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述基于对齐后的各模态的特征,以及数据质量指标、业务标签和设备生命周期参数,计算各模态权重,包括:
7.根据权利要求6所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,所述通过预设的突发事件关键词检测及传感器突变响应策略动态调整各模态权重分配,完成优化,包括:
8.基于大模型的多模态数据库动态融合优化系统,其特征在于,包括:
9.根据权利要求8所述的基于大模型的多模态数据库动态融合优化方法,其特征在于,数据清洗模块中,所述基于大语言模型对电力多模态数据进行清洗,得到清洗后的电力多模态数据,包括:...
【专利技术属性】
技术研发人员:邹莹,范晓宣,王志皓,梁潇,朱珈徵,姚建光,徐晓轶,
申请(专利权)人:中国电力科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。