一种基于图像识别的大数据采集方法、数据管理方法及系统技术方案

技术编号:38008600 阅读:11 留言:0更新日期:2023-06-30 10:27
本发明专利技术提出了一种基于图像识别的大数据采集方法、数据管理方法及系统,涉及计算机技术领域。该方法包括:根据检索文字信息,确定现实三维场景模型。将仿真相机布设于现实三维场景模型,获取图像画面,计算图像画面的可见区域。刻画真实相机拍摄视角下的拍摄画面,得到预选图片,更改仿真相机位置,得到多个预选图片。遍历所有现实三维场景模型,得到各自的多个预选图片。分别提取示例图片和多个预选图片的GIST特征,判断是否将多个预选图片作为待采集图片。遍历所有现实三维场景模型,以采集所有待采集图片。实现了借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片的目的。的多个预选图片中确定待采集图片的目的。的多个预选图片中确定待采集图片的目的。

【技术实现步骤摘要】
一种基于图像识别的大数据采集方法、数据管理方法及系统


[0001]本专利技术涉及计算机
,具体而言,涉及一种基于图像识别的大数据采集方法、数据管理方法及系统。

技术介绍

[0002]随着科技的发展,人们经常会遇到需要获取大量图片数据的情况,例如人工智能算法需要大量数据训练模型,经过训练的模型才可以用来推理,实现对新数据的识别。再例如做摄影、油画类的艺术工作需要大量参考图。目前,人们获取大量的需求图片通常有以下两种方式:第一种方式是在通过真实相机线下拍摄真实场景获取需求图片,这种方式不仅要求真实相机具有足够的内存,而且需要拍摄者实际到达拍摄现场进行拍摄,十分不方便。
[0003]第二种方式是通过网络上搜索获取需求图片,这种方式获取的图片不仅存在可能不符合用户需求的问题,而且也难以获取大量有效的图片数据,以实现对图片的采集,而且同样也十分耗时耗力。

技术实现思路

[0004]本专利技术的目的在于提供一种基于图像识别的大数据采集方法、数据管理方法及系统,其能够借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片。
[0005]为解决上述技术问题,本专利技术采用的技术方案为:第一方面,本申请实施例提供一种基于图像识别的大数据采集方法,包括如下步骤:S110:获取任务参数,任务参数包括检索文字信息和示例图片;S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,
以得到预选图片和示例图片对应的全局表征结果;S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片。
[0006]在本专利技术中,进一步的,上述S180的步骤包括:根据全局表征结果,利用多个预选图片与示例图片进行匹配;当示例图片匹配到的预选图片的数量低于预设数量时,判定不将现实三维场景模型的多个预选图片作为待采集图片;当示例图片匹配到的预选图片的数量不低于预设数量时,判定将现实三维场景模型的多个预选图片作为待采集图片。
[0007]在本专利技术中,进一步的,上述S120的步骤包括:将检索文字信息输入至关键词分析模型中,得到多个关键词;将多个关键词输入至预置场景模型数据库中进行匹配,确定至少一个现实三维场景模型。
[0008]在本专利技术中,进一步的,上述将多个关键词输入至预置场景模型数据库中进行匹配的步骤之前,还包括:获取多种类型的真实场景信息,其中,任一真实场景信息包括场景特点信息和真实场景中的所有真实物体参数;根据所有真实物体参数,建立现实三维场景模型;根据场景特点信息,为现实三维场景模型配置标识ID;根据标识ID,对现实三维场景模型进行封装后,保存至预置场景模型数据库中。
[0009]在本专利技术中,进一步的,上述S130的步骤之前,还包括:获取真实相机参数;根据真实相机参数配置仿真相机参数,仿真相机参数包括仿真相机的拍摄视角。
[0010]在本专利技术中,进一步的,上述基于图像画面,计算得到可见区域和不可见区域的步骤包括:获取每个像素点在图像画面中的第一深度值,并获取每个像素点在默认视图下的第二深度值;若第一深度值大于第二深度值,则像素点属于不可见区域;若第一深度值小于第二深度值,则像素点属于可见区域。
[0011]第二方面,本申请实施例提供一种数据管理方法,包括如下步骤:S110:获取任务参数,任务参数包括检索文字信息和示例图片;S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,
刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片;S200:按照预设时间范围,创建多个索引文件,并根据任一待采集图片的获得时间,将待采集图片存入对应的索引文件中,同时根据待采集图片的获得时间和对应的现实三维场景模型,为待采集图片编号;S210:根据多个索引文件,建立索引目录,以得到图片集合。
[0012]第三方面,本申请实施例提供一种基于图像识别的大数据采集系统,包括:任务参数获取模块,用于获取任务参数,任务参数包括检索文字信息和示例图片;现实三维场景模型确定模块,用于根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;仿真相机布设模块,用于响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;预选图片得到模块,用于根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;仿真相机遍历模块,用于重复执行仿真相机布设模块至预选图片得到模块,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;现实三维场景模型遍历模块,用于重复执行仿真相机布设模块至仿真相机遍历模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像识别的大数据采集方法,其特征在于,包括如下步骤:S110:获取任务参数,所述任务参数包括检索文字信息和示例图片;S120:根据所述检索文字信息,确定至少一个现实三维场景模型,其中,所述现实三维场景模型包括至少一个物体三维模型;S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一所述现实三维场景模型中,同时根据所述仿真相机的拍摄视角获取所述仿真相机拍摄的图像画面,基于所述图像画面,计算得到可见区域和不可见区域;S140:根据所述可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画所述真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改所述仿真相机在所述现实三维场景模型中的位置;S150:重复执行S130至S140,直至所述仿真相机的位置更改次数达到预设次数,得到所述现实三维场景模型相匹配的多个预选图片;S160:重复执行S130至S150,直至遍历所有所述现实三维场景模型,得到所有所述现实三维场景模型的多个预选图片;S170:分别提取所述示例图片和任一所述现实三维场景模型的所述多个预选图片的GIST特征,以得到所述预选图片和所述示例图片对应的全局表征结果;S180:根据所述全局表征结果,判断是否将所述现实三维场景模型的所述多个预选图片作为待采集图片,若是,则将所述现实三维场景模型的所述多个预选图片作为待采集图片进行采集;S190:重复执行S170至S180,直至遍历所有所述现实三维场景模型的所述多个预选图片,以采集所有待采集图片。2.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述S180的步骤包括:根据所述全局表征结果,利用所述多个预选图片与所述示例图片进行匹配;当所述示例图片匹配到的所述预选图片的数量低于预设数量时,判定不将所述现实三维场景模型的所述多个预选图片作为待采集图片;当所述示例图片匹配到的所述预选图片的数量不低于所述预设数量时,判定将所述现实三维场景模型的所述多个预选图片作为待采集图片。3.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述S120的步骤包括:将所述检索文字信息输入至关键词分析模型中,得到多个关键词;将所述多个关键词输入至预置场景模型数据库中进行匹配,确定至少一个所述现实三维场景模型。4.根据权利要求3所述的基于图像识别的大数据采集方法,其特征在于,所述将所述多个关键词输入至预置场景模型数据库中进行匹配的步骤之前,还包括:获取多种类型的真实场景信息,其中,任一所述真实场景信息包括场景特点信息和真实场景中的所有真实物体参数;根据所述所有真实物体参数,建立所述现实三维场景模型;根据所述场景特点信息,为所述现实三维场景模型配置标识ID;
根据所述标识ID,对所述现实三维场景模型进行封装后,保存至所述预置场景模型数据库中。5.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述S130的步骤之前,还包括:获取真实相机参数;根据所述真实相机参数配置仿真相机参数,所述仿真相机参数包括所述仿真相机的拍摄视角。6.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述基于所述图像画面,计算得到可见区域和不可见区域的步骤包括:获取每个像素点在所述图像画面中的第一深度值,并获取每个像素点在默认视图下的第二深度值;若所述第一深度值大于所述第二深度值,则所述像素点属于不可见区域;若所述第一深度值小于所述第二深度值,则所述像素点属于可见区域。7.一种数据管理方法,其特征在于,包括如下步骤:S110:获取任务参数,所述任务参数包括检索文字信息和示例图片;S120:根据所述检索文字信息,确定至少一个现实三维场景模型,其中,所述现实三维场景模型包括至少一个物体三维模型;S130:响应用户操作将与真实相机相...

【专利技术属性】
技术研发人员:贺敬川康凤珠徐斌张劲胜李勇吕楠吴默然付国龙
申请(专利权)人:四川新迎顺信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1