【技术实现步骤摘要】
一种基于众包的图片标注系统
本专利技术涉及一种图片标注系统,具体涉及一种基于众包的图片标注系统,属于图片标注
技术介绍
机器视觉系统在训练过程中,需要通过识别已经标注好的样本来逐步提高机器视觉系统识别图片的准确性。这样就需要提前准备海量已经标注好的训练样本图片。传统的制作训练样本的方法是集中一部分人,以人工方式对图片标签化,这种方式不仅效率低,而且因为每个人具备的专业知识不一样,导致标注的质量参差不齐。现有的图片标注系统如LabelImg、BBox-Label-Tool等仅支持单个用户对图片进行标注,但不能根据用户的专业知识背景对图片进行分发,我们需要一个智能系统能够让大量的图片得到快速、准确的标注。随着互联网的高速发展,众包模式逐渐深入我们的生活:更多的企业利用互联网将工作分配出去、发现创意或解决技术问题;更多的用户愿意利用自己的闲散时间做一些力所能及的事,收取小额报酬或者不计报酬。在诸如维基百科或是YouTube这样的UGC网站中,企业、组织的核心价值几乎完全来自用户进行的价值创造,而且不产生任何直接成本。越来越多的传统企业在互联网上运用这种模式,并取得了成功。发展至今,众包模式已经在各个行业中有成型的移动端或网页端产品,所涉及的行业包括非政府组织、地图、天气预报、设计、图片、输入法、主题、用车、生活服务、餐饮、快递、医疗、家政等。在这样的背景下,采用众包的方式可以解决海量图片标注过程中效率、标注准确度差等问题,从而提升图片标注的速度和准确度。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于众包的图片标注系统,采用众包的方式,让有专业 ...
【技术保护点】
1.一种基于众包的图片标注系统,其特征在于,包括图片发布者WEB模块、服务器模块、志愿者APP模块;其中,图片发布者WEB模块包括图片发布模块、图片管理模块、标注结果导出模块;服务器模块包括图片初始标注模块、图片推荐模块、图片标注完成判定模块、用户积分及恶意标注判定模块;志愿者APP模块包括个人信息管理模块、历史标注模块、图片搜索模块、今日推荐模块、图片标注模块;所述图片发布模块用于图片发布者向图片初始标注模块批量发布待标注图片以及待标注图片的标注需求;图片管理模块用于图片发布者查看待标注图片的标注进度,以及对图片进行管理;标注结果导出模块用于在图片标注完成判定模块判定图片标注完成后,图片发布者对标注完成的图片进行批量导出;所述图片初始标注模块用于对图片发布模块发布的待标注图片进行自动识别并初始标注;图片推荐模块用于将经图片初始标注模块初始标注过的图片有针对性的推送给具有专业背景或对应兴趣的众包志愿者;图片标注完成判定模块用于判定待标注图片是否标注完成并确定图片最终标注;用户积分及恶意判定模块用于计算众包志愿者的积分及判定众包志愿者是否进行恶意标注,并对恶意标注进行判罚;所述个人信息管 ...
【技术特征摘要】
1.一种基于众包的图片标注系统,其特征在于,包括图片发布者WEB模块、服务器模块、志愿者APP模块;其中,图片发布者WEB模块包括图片发布模块、图片管理模块、标注结果导出模块;服务器模块包括图片初始标注模块、图片推荐模块、图片标注完成判定模块、用户积分及恶意标注判定模块;志愿者APP模块包括个人信息管理模块、历史标注模块、图片搜索模块、今日推荐模块、图片标注模块;所述图片发布模块用于图片发布者向图片初始标注模块批量发布待标注图片以及待标注图片的标注需求;图片管理模块用于图片发布者查看待标注图片的标注进度,以及对图片进行管理;标注结果导出模块用于在图片标注完成判定模块判定图片标注完成后,图片发布者对标注完成的图片进行批量导出;所述图片初始标注模块用于对图片发布模块发布的待标注图片进行自动识别并初始标注;图片推荐模块用于将经图片初始标注模块初始标注过的图片有针对性的推送给具有专业背景或对应兴趣的众包志愿者;图片标注完成判定模块用于判定待标注图片是否标注完成并确定图片最终标注;用户积分及恶意判定模块用于计算众包志愿者的积分及判定众包志愿者是否进行恶意标注,并对恶意标注进行判罚;所述个人信息管理模块用于管理众包志愿者的基本信息、专业背景和兴趣;历史标注模块用于众包志愿者查看、删除、修改尚未被采纳的标签;图片搜索模块用于对待标注图片进行搜索,为当前众包志愿者提供符合要求的待标注图片;今日推荐模块用于众包志愿者查看图片推荐模块为其推荐的待标注图片;图片标注模块用于众包志愿者对待标注图片进行标注。2.根据权利要求1所述基于众包的图片标注系统,其特征在于,所述图片推荐模块的具体工作过程如下:(1)获取所有众包志愿者的信息构成集合personList={person1,person2,…,personn},personi表示第i个众包志愿者的信息,包括众包志愿者的专业、兴趣、信用值、积分、打过标签图片信息、历史标签信息,i=1,…,n,n为众包志愿者的数量;(2)获取经图片初始标注模块初始标注过的所有图片的信息构成集合pictureList={picture1,picture2,…,picturem},pictureu表示第u张图片的信息,包括图片路径、图片已有初始标签信息,u=1,…,m,m为待标注图片的数量;(3)对于personList中的每一个众包志愿者,进行基于众包志愿者的协同过滤,具体操作如下:A)判断当前众包志愿者是否具有专业背景或对应兴趣,若无则转(5),否则转B);B)根据专业、兴趣计算当前众包志愿者与personList中其他各众包志愿者的相似度,计算公式如下:其中,j=1,…,n,i≠j,Wij为当前第i个众包志愿者与第j个众包志愿者之间的相似度,β为专业相似度权重,N(·)为众包志愿者的专业集合,M(·)为众包志愿者的兴趣集合,crditj为第j个众包志愿者的积分;C)对B)得到的所有相似度从大到小进行排序,将相似度高的前s个众包志愿者打过标签的图片进行初步保留,形成中间结果集temp-result;(4)对中间结果集temp-result进行扩充,使中间结果集的数量达到值leastTempNum,按打过标签的图片进行优先扩充;(5)判断当前众包志愿者是否打过标签,若无则转(7),否则转(6)进行基于图片的协同过滤;(6)将当前众包志愿者打过的标签集合与中间结果集temp-result中各图片已被打上的标签集合进行相似度计算,对所有得到的相似度进行排序,将相似度高于预设阈值的图片保留下来作为最终结果集final-set进行推荐;所述相似度计算公式如下:其中,Sia为当前第i个众包志愿者与中间结果集temp-result中第a张...
【专利技术属性】
技术研发人员:刘凡,张嘉韬,毛莺池,许峰,
申请(专利权)人:河海大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。