网页分割适配方法、系统、装置及介质制造方法及图纸

技术编号:42682427 阅读:25 留言:0更新日期:2024-09-10 12:31
本发明专利技术提供了一种网页分割适配方法及系统,其中方法包括:提供一预训练的通用视觉分割模型;在所述预训练的通用视觉分割模型的图像编码器部分,提供一综合网页分割适应性微调模块;利用所述综合网页分割适应性微调模块,对所述预训练的通用视觉分割模型进行精细化训练,并对所述预训练的通用视觉分割模型的掩膜解码器部分进行结构微调,得到精细化的通用视觉分割模型;对所述精细化的通用视觉分割模型输出的视觉分割结果进行后处理,合并重叠的分割框以及细化和校正分割框位置,得到最终的分割结果。本发明专利技术有效地解决了通用视觉分割模型在网页分割领域的局限性,提升了处理效率和结果准确性,适合应用于信息检索等场景。

【技术实现步骤摘要】

本专利技术涉及网页信息技术检索,具体地,涉及一种高效的网页分割适配方法、系统、装置及介质


技术介绍

1、随着互联网的飞速发展,web已经成为全球最大的信息库。在这个信息丰富的环境中,网页作为web的基本单元,往往融合了多个主题和独立的内容块。为了更深入地理解和高效利用这些内容,网页分割技术应运而生。

2、web网页主要基于html(hypertext markup language)进行构建。作为创建网页的标准标记语言,html使得浏览器能够解读并将其渲染为可视化的网页内容。html文档由多个嵌套元素构成,这些元素共同形成了一个称为dom(document object model)的文档结构树状结构。在此结构中,每个节点都对应一个html标记。这些标记及其属性、字符数据类型、字符引用和实体引用等关键组件,使得网页设计人员能够在网页中嵌入图像、对象,创建交互式表单,并结构化地表示各种语义信息。

3、网页分割的核心目标是根据人类的视觉感知将网页内容划分为不同的语义或功能区块。网页分割作为计算机视觉和信息检索交叉领域的关键技术,它针对本文档来自技高网...

【技术保护点】

1.一种网页分割适配方法,其特征在于,包括:

2.根据权利要求1所述的网页分割适配方法,其特征在于,所述提供一预训练的通用视觉分割模型,包括:

3.根据权利要求1所述的网页分割适配方法,其特征在于,在所述预训练的通用视觉分割模型的图像编码器部分,提供一综合网页分割适应性微调模块,包括:

4.根据权利要求1所述的网页分割适配方法,其特征在于,利用所述综合网页分割适应性微调模块,对所述预训练的通用视觉分割模型进行精细化训练,并对所述预训练的通用视觉分割模型的掩膜解码器部分进行结构微调,包括:

5.根据权利要求1所述的网页分割适配方法,其特征在于...

【技术特征摘要】

1.一种网页分割适配方法,其特征在于,包括:

2.根据权利要求1所述的网页分割适配方法,其特征在于,所述提供一预训练的通用视觉分割模型,包括:

3.根据权利要求1所述的网页分割适配方法,其特征在于,在所述预训练的通用视觉分割模型的图像编码器部分,提供一综合网页分割适应性微调模块,包括:

4.根据权利要求1所述的网页分割适配方法,其特征在于,利用所述综合网页分割适应性微调模块,对所述预训练的通用视觉分割模型进行精细化训练,并对所述预训练的通用视觉分割模型的掩膜解码器部分进行结构微调,包括:

5.根据权利要求1所述的网页分割适配方法,其特征在于,所述对所述精细化的通用视觉分割模型输出的视觉分割结果进行后处理,合并重叠的分割框以及细化和校正分割框位置,包括:

6.根据权利要求5所述的网页分割适配方法,其...

【专利技术属性】
技术研发人员:张重阳任博闻高超金越
申请(专利权)人:中国太平洋保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1