多源异构数据的语义对齐方法、装置、设备及存储介质制造方法及图纸

技术编号:38348732 阅读:34 留言:0更新日期:2023-08-02 09:28
本发明专利技术涉及信息处理技术领域,公开了多源异构数据的语义对齐方法、装置、设备及存储介质,方法包括:获取多模态数据集,多模态数据集包括:电力图像数据库和电力文本数据库;对图像数据、文本数据进行语义特征提取,提取出相应的图像特征向量、文本特征向量;通过预设线性自编码器,将提取到的图像特征向量映射到文本特征向量中,获取图像和文本对齐的编码结果;将编码结果输入到预设解码器中,输出重构图像特征向量。通过本发明专利技术提供的方法实现电网场景下多源异构数据的语义对齐。场景下多源异构数据的语义对齐。场景下多源异构数据的语义对齐。

【技术实现步骤摘要】
多源异构数据的语义对齐方法、装置、设备及存储介质


[0001]本专利技术涉及信息处理
,具体涉及多源异构数据的语义对齐方法、装置、设备及存储介质。

技术介绍

[0002]人工智能技术的高速发展为电力领域感知世界赋予了无限活力,变电站里主设备安装了多种传感器,随着时间的推移,传感器采集了庞大的数据,例如图像、语音、文本等,用于支撑多源异构数据分析。然而,多源异构数据来自不同的模态,特征之间存在异质鸿沟,由于各个特征之间的语义差异,无法对其直接进行语义关联分析。为了更好地服务电力业务,如何对采集到的电力多源异构数据进行语义对齐是目前亟需解决的难题。

技术实现思路

[0003]有鉴于此,本专利技术提供了一种多源异构数据的语义对齐方法、装置、设备及存储介质,以解决电力多源异构数据语义不齐的问题。
[0004]第一方面,本专利技术提供了一种多源异构数据的语义对齐方法,方法包括:获取多模态数据集,多模态数据集包括:电力图像数据库和电力文本数据库;对图像数据、文本数据进行语义特征提取,提取出相应的图像特征向量、文本特征向量;通过本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多源异构数据的语义对齐方法,其特征在于,所述方法包括:获取多模态数据集,所述多模态数据集包括:电力图像数据库和电力文本数据库;对图像数据、文本数据进行语义特征提取,提取出相应的图像特征向量、文本特征向量;通过预设线性自编码器,将提取到的图像特征向量映射到文本特征向量中,获取图像和文本对齐的编码结果;将编码结果输入到预设解码器中,输出重构图像特征向量。2.根据权利要求1所述的方法,其特征在于,预设线性自编码器包括:构造预设目标函数及优化该预设目标函数。3.根据权利要求2所述的方法,其特征在于,所述预设目标函数为:,其中,为图像特征数据集,为文本特征数据集,为预设编码器,F为范数,通过该编码器,将V映射到文本特征向量中,为控制预设编码器和预设解码器的权重参数。4.根据权利要求3所述的方法,其特征在于,对预设目标函数进行优化,包括:对预设目标函数进行求导,其计算公式为:。5.一种多源异构数...

【专利技术属性】
技术研发人员:郑敏吴春鹏刘卫卫陈帅柴博林龙周飞
申请(专利权)人:国网智能电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1