【技术实现步骤摘要】
本专利技术涉及数据处理,具体涉及一种基于互联网信息爬取的楷木雕刻资源库建设方法及系统。
技术介绍
1、互联网信息爬取是通过网络爬虫采集互联网上的数据,网络爬虫是一种按照一定的规则,自动地抓取web信息的程序或者脚本。
2、楷木雕是一项独特的传统手工艺术,具有独特的艺术风格和特征,距今已有2400余年的历史,有着重要的历史价值,因此需要做好保护和传承,做好楷木资源库的建设。但由于其复杂的制作工艺和丰富的种类,目前还存在楷木图片资源筛选难度高,导致筛选到的图片准确度低,楷木资源库资源质量差的问题。
技术实现思路
1、本申请提供了一种基于互联网信息爬取的楷木雕刻资源库建设方法及系统,用于由于获取的楷木图片资源的准确度低,导致楷木资源库资源质量差的技术问题。
2、本申请的第一个方面,提供了一种基于互联网信息爬取的楷木雕刻资源库建设方法,所述方法包括:设定爬取因子,基于所述爬取因子自动爬取互联网图片,构建图片数据集;按照预设分类特征对所述图片数据集进行分类,获得图片分类集群,
...【技术保护点】
1.一种基于互联网信息爬取的楷木雕刻资源库建设方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述按照预设分类特征对所述图片数据集进行分类,获得图片分类集群,包括:
3.如权利要求2所述的方法,其特征在于,所述将图片数据集中的图片输入边框识别模型,获得图片边框识别结果,包括:
4.如权利要求2所述的方法,其特征在于,将所述图片分类集群与匹配标准特征集输入所述孪生网络判别模型中,之前包括:
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
6.如权利要求1所述的方法,其特征在于
...【技术特征摘要】
1.一种基于互联网信息爬取的楷木雕刻资源库建设方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述按照预设分类特征对所述图片数据集进行分类,获得图片分类集群,包括:
3.如权利要求2所述的方法,其特征在于,所述将图片数据集中的图片输入边框识别模型,获得图片边框识别结果,包括:
4.如权利要求2所述的方法,其特征在于,将所述图片分类集群与匹配标准特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。