【技术实现步骤摘要】
应用于电力设备巡检报告图文的模型预训练方法及设备
[0001]本专利技术涉及模型训练领域,尤其涉及一种应用于电力设备巡检报告图文的模型预训练方法及设备。
技术介绍
[0002]在电网领域的实际场景中,捕获设备状态信息的途径增多,数据传输效率的不断提升,终端系统中的信息存储量也随之增加,这使得应用于该领域的人工智能模型诸如图像检索模型、异常检测模型,需要扩充计算参数的规模。但在终端设备中,有限的计算资源限制了模型规模的上界,进而限制了模型性能的提升。对此,提出一个部署在大型计算设备上的预训练模型,可以有效降低模型应用在下游任务时对硬件环境的依赖,并降低其训练时间,提高相应速度。帮助相关工作人员提升分析问题和做出决策的效率。
[0003]在电力领域,以往的预训练方法通常针对图片或文本这种单一模态,导致预训练模型不能很好学习多模态的交互信息,进而限制了模型的适用范围。
技术实现思路
[0004]为了解决上述技术问题,本专利技术实施例提出了一种应用于电力设备巡检报告图文的模型预训练方法及设备。
[0005]本专利技术实施例提供了一种应用于电力设备巡检报告图文的模型预训练方法,包括:
[0006]获取电力设备巡检报告中的图像和所述图像所对应的文本信息;
[0007]将所述图像输入至预先配置的图像编码器,得到所述图像编码器输出的图像特征;
[0008]将所述图像所对应的文本信息输入至预先配置的文本编码器,得到所述文本编码器输出的文本特征;
[0009]基于所述图像特 ...
【技术保护点】
【技术特征摘要】
1.一种应用于电力设备巡检报告图文的模型预训练方法,其特征在于,包括:获取电力设备巡检报告中的图像和所述图像所对应的文本信息;将所述图像输入至预先配置的图像编码器,得到所述图像编码器输出的图像特征;将所述图像所对应的文本信息输入至预先配置的文本编码器,得到所述文本编码器输出的文本特征;基于所述图像特征和所述文本特征,进行特征匹配训练,以训练对比模型;其中,所述对比模型用于表征所述图像特征和所述文本特征之间的关联性;存储训练完成的对比模型的模型参数。2.如权利要求1所述的应用于电力设备巡检报告图文的模型预训练方法,其特征在于,所述模型参数包括对比模型的输出结构参数;则,在所述存储训练完成的对比模型的模型参数之后,还包括:根据若干预设的电力设备下游任务一一对应调整所述输出结构参数,以使得所述对比模型输出与各个所述电力设备下游任务一一对应的输出结果。3.如权利要求1所述的应用于电力设备巡检报告图文的模型预训练方法,其特征在于,所述获取电力设备巡检报告中的图像和所述图像所对应的文本信息,具体包括:采用OCR模型从若干电力设备巡检报告中提取图像和文本描述;其中,所述文本描述包括线路名称、设备名称、缺陷描述和缺陷等级;构建由所述图像组成的图像列表;采用合并算法对提取到的文本描述进行迭代合并,得到用于表征设备描述信息的通用描述列表,去除所述通用描述列表中重复的字段后得到文本列表,通过并查集算法构建所述图像列表与所述文本列表之间的映射关系,以使所述文本列表中的文本信息与所述图像列表中的图像一一对应。4.如权利要求1所述的应用于电力设备巡检报告图文的模型预训练方法,其特征在于,所述图像编码器包括卷积神经网络和Transformer编码器;则,所述将所述图像输入至预先配置的图像编码器,得到所述图像编码器输出的图像特征,具体包括:将所述图像裁剪为预设格式;将裁剪后的图像输入至包括卷积核和最大池化层的所述卷积神经网络,得到所述卷积神经网络输出的局部特征图;其中,所述局部特征图包括局部特征和关键特征,所述卷积核用于提取所述局部特征,所述最大池化层用于从所述局部特征中提取所述关键特征;将所述局部特征图输入至包括多头自注意力模块的Transformer编码器,得到所述Transformer编码器输出的图像特征;其中,所述多头自注意力模块用于对所述局部特征图进行计算得到全局特征。5.如权利要求1所述的应用于电力设备巡检报告图文的模型预训练方法,其特征在于,所述文本编码器包括k
‑
gram文本抽取器和文本多头自注意力模块;则,所述将所述图像所对应的文本信息输入至预先配置的文本编码器,得到所述文本编码器输出的文本特征,具体包括:将所述图像所对应的文本信息输入至所述k
‑
gram文本抽取器,以对所述图像所对应的文本信息进行分词...
【专利技术属性】
技术研发人员:赵宗罗,赵志新,李强强,周波,蒋良,许毅,罗良,盛成海,王立森,俞腾飞,李亚波,吕捷,帅万高,姚毅滨,孔令令,胡宇芬,周桀鹏,
申请(专利权)人:国网浙江省电力有限公司杭州供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。