当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于众包的图片标注系统技术方案

技术编号:19479904 阅读:24 留言:0更新日期:2018-11-17 10:31
本发明专利技术公开了一种基于众包的图片标注系统,包括图片发布者WEB模块、服务器模块、志愿者APP模块;其中,图片发布者WEB模块包括图片发布模块、图片管理模块、标注结果导出模块;服务器模块包括图片初始标注模块、图片推荐模块、图片标注完成判定模块、用户积分及恶意标注判定模块;志愿者APP模块包括个人信息管理模块、历史标注模块、图片搜索模块、今日推荐模块、图片标注模块。图片发布者通过WEB平台发布待标注图片,服务器模块首先通过图片初始标注模块对图片进行自动化的初始标注,之后采用基于协同过滤的推荐算法,将需要进行标注的图片推送到有对应兴趣或专业知识背景的众包志愿者的标注APP中进行标注,从而实现对大量图片进行快速准确标注的效果。

【技术实现步骤摘要】
一种基于众包的图片标注系统
本专利技术涉及一种图片标注系统,具体涉及一种基于众包的图片标注系统,属于图片标注

技术介绍
机器视觉系统在训练过程中,需要通过识别已经标注好的样本来逐步提高机器视觉系统识别图片的准确性。这样就需要提前准备海量已经标注好的训练样本图片。传统的制作训练样本的方法是集中一部分人,以人工方式对图片标签化,这种方式不仅效率低,而且因为每个人具备的专业知识不一样,导致标注的质量参差不齐。现有的图片标注系统如LabelImg、BBox-Label-Tool等仅支持单个用户对图片进行标注,但不能根据用户的专业知识背景对图片进行分发,我们需要一个智能系统能够让大量的图片得到快速、准确的标注。随着互联网的高速发展,众包模式逐渐深入我们的生活:更多的企业利用互联网将工作分配出去、发现创意或解决技术问题;更多的用户愿意利用自己的闲散时间做一些力所能及的事,收取小额报酬或者不计报酬。在诸如维基百科或是YouTube这样的UGC网站中,企业、组织的核心价值几乎完全来自用户进行的价值创造,而且不产生任何直接成本。越来越多的传统企业在互联网上运用这种模式,并取得了成功。发展至今,众包模式已经在各个行业中有成型的移动端或网页端产品,所涉及的行业包括非政府组织、地图、天气预报、设计、图片、输入法、主题、用车、生活服务、餐饮、快递、医疗、家政等。在这样的背景下,采用众包的方式可以解决海量图片标注过程中效率、标注准确度差等问题,从而提升图片标注的速度和准确度。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于众包的图片标注系统,采用众包的方式,让有专业知识背景或对应兴趣的用户对图片进行标注,从而使图片得到快速、准确的标注。本专利技术为解决上述技术问题采用以下技术方案:一种基于众包的图片标注系统,包括图片发布者WEB模块、服务器模块、志愿者APP模块;其中,图片发布者WEB模块包括图片发布模块、图片管理模块、标注结果导出模块;服务器模块包括图片初始标注模块、图片推荐模块、图片标注完成判定模块、用户积分及恶意标注判定模块;志愿者APP模块包括个人信息管理模块、历史标注模块、图片搜索模块、今日推荐模块、图片标注模块;所述图片发布模块用于图片发布者向图片初始标注模块批量发布待标注图片以及待标注图片的标注需求;图片管理模块用于图片发布者查看待标注图片的标注进度,以及对图片进行管理;标注结果导出模块用于在图片标注完成判定模块判定图片标注完成后,图片发布者对标注完成的图片进行批量导出;所述图片初始标注模块用于对图片发布模块发布的待标注图片进行自动识别并初始标注;图片推荐模块用于将经图片初始标注模块初始标注过的图片有针对性的推送给具有专业背景或对应兴趣的众包志愿者;图片标注完成判定模块用于判定待标注图片是否标注完成并确定图片最终标注;用户积分及恶意判定模块用于计算众包志愿者的积分及判定众包志愿者是否进行恶意标注,并对恶意标注进行判罚;所述个人信息管理模块用于管理众包志愿者的基本信息、专业背景和兴趣;历史标注模块用于众包志愿者查看、删除、修改尚未被采纳的标签;图片搜索模块用于对待标注图片进行搜索,为当前众包志愿者提供符合要求的待标注图片;今日推荐模块用于众包志愿者查看图片推荐模块为其推荐的待标注图片;图片标注模块用于众包志愿者对待标注图片进行标注。作为本专利技术的一种优选方案,所述图片推荐模块的具体工作过程如下:(1)获取所有众包志愿者的信息构成集合personList={person1,person2,…,personn},personi表示第i个众包志愿者的信息,包括众包志愿者的专业、兴趣、信用值、积分、打过标签图片信息、历史标签信息,i=1,…,n,n为众包志愿者的数量;(2)获取经图片初始标注模块初始标注过的所有图片的信息构成集合pictureList={picture1,picture2,…,picturem},pictureu表示第u张图片的信息,包括图片路径、图片已有初始标签信息,u=1,…,m,m为待标注图片的数量;(3)对于personList中的每一个众包志愿者,进行基于众包志愿者的协同过滤,具体操作如下:A)判断当前众包志愿者是否具有专业背景或对应兴趣,若无则转(5),否则转B);B)根据专业、兴趣计算当前众包志愿者与personList中其他各众包志愿者的相似度,计算公式如下:其中,j=1,…,n,i≠j,Wij为当前第i个众包志愿者与第j个众包志愿者之间的相似度,β为专业相似度权重,N(·)为众包志愿者的专业集合,M(·)为众包志愿者的兴趣集合,crditj为第j个众包志愿者的积分;C)对B)得到的所有相似度从大到小进行排序,将相似度高的前s个众包志愿者打过标签的图片进行初步保留,形成中间结果集temp-result;(4)对中间结果集temp-result进行扩充,使中间结果集的数量达到值leastTempNum,按打过标签的图片进行优先扩充;(5)判断当前众包志愿者是否打过标签,若无则转(7),否则转(6)进行基于图片的协同过滤;(6)将当前众包志愿者打过的标签集合与中间结果集temp-result中各图片已被打上的标签集合进行相似度计算,对所有得到的相似度进行排序,将相似度高于预设阈值的图片保留下来作为最终结果集final-set进行推荐;所述相似度计算公式如下:其中,Sia为当前第i个众包志愿者与中间结果集temp-result中第a张图片的相似度,L(i)为当前第i个众包志愿者打过的标签集合,L(a)为第a张图片已被打上的标签集合,num(x)为标签x在L(a)中的出现次数;(7)对最终结果集final-set进行扩充,对于没有专业背景或相应兴趣也没有标注记录的众包志愿者随机添加图片进行扩充,使最终结果集final-set的数量达到值leastFinalNum;(8)将最终得到的对每个众包志愿者推荐的最终结果集final-set,保存到数据库中,并记录要推荐的图片路径;(9)当志愿者APP模块请求每日推荐的图片时,服务器模块通过查找数据库将相应的图片路径反馈给今日推荐模块。作为本专利技术的一种优选方案,所述图片标注完成判定模块包括标签语义处理模块、智能化标签判定模块、智能化标签推荐模块;所述标签语义处理模块用于采用NLPIR汉语分词系统以及同义词词林,对众包志愿者标注的标签进行词性分析、词性标注、近义词归类,得到最终的标签结果;智能化标签判定模块用于对经过标签语义处理模块处理好的标签进行判定,从而判断图片是否标注完成;智能化标签推荐模块用于结合标签语义处理模块处理好的标签以及众包志愿者经常使用的标签,对众包志愿者标注的每张图片进行标签推荐。作为本专利技术的一种优选方案,所述标签语义处理模块的具体工作过程如下:(1)对于所有待标注图片,获取每张待标注图片经图片标注模块后,得到的所有标签信息并构成标签集tagList;(2)对于每张待标注图片的标签集tagList,进行以下操作:A)对标签集tagList中的每个标签使用汉语分词系统进行分词、词性标注,删去副词、动词、形容词,得到初步处理的标签集tagList_temp;B)对初步处理的标签集tagList_temp使用同义词词林进行标签相似度本文档来自技高网...

【技术保护点】
1.一种基于众包的图片标注系统,其特征在于,包括图片发布者WEB模块、服务器模块、志愿者APP模块;其中,图片发布者WEB模块包括图片发布模块、图片管理模块、标注结果导出模块;服务器模块包括图片初始标注模块、图片推荐模块、图片标注完成判定模块、用户积分及恶意标注判定模块;志愿者APP模块包括个人信息管理模块、历史标注模块、图片搜索模块、今日推荐模块、图片标注模块;所述图片发布模块用于图片发布者向图片初始标注模块批量发布待标注图片以及待标注图片的标注需求;图片管理模块用于图片发布者查看待标注图片的标注进度,以及对图片进行管理;标注结果导出模块用于在图片标注完成判定模块判定图片标注完成后,图片发布者对标注完成的图片进行批量导出;所述图片初始标注模块用于对图片发布模块发布的待标注图片进行自动识别并初始标注;图片推荐模块用于将经图片初始标注模块初始标注过的图片有针对性的推送给具有专业背景或对应兴趣的众包志愿者;图片标注完成判定模块用于判定待标注图片是否标注完成并确定图片最终标注;用户积分及恶意判定模块用于计算众包志愿者的积分及判定众包志愿者是否进行恶意标注,并对恶意标注进行判罚;所述个人信息管理模块用于管理众包志愿者的基本信息、专业背景和兴趣;历史标注模块用于众包志愿者查看、删除、修改尚未被采纳的标签;图片搜索模块用于对待标注图片进行搜索,为当前众包志愿者提供符合要求的待标注图片;今日推荐模块用于众包志愿者查看图片推荐模块为其推荐的待标注图片;图片标注模块用于众包志愿者对待标注图片进行标注。...

【技术特征摘要】
1.一种基于众包的图片标注系统,其特征在于,包括图片发布者WEB模块、服务器模块、志愿者APP模块;其中,图片发布者WEB模块包括图片发布模块、图片管理模块、标注结果导出模块;服务器模块包括图片初始标注模块、图片推荐模块、图片标注完成判定模块、用户积分及恶意标注判定模块;志愿者APP模块包括个人信息管理模块、历史标注模块、图片搜索模块、今日推荐模块、图片标注模块;所述图片发布模块用于图片发布者向图片初始标注模块批量发布待标注图片以及待标注图片的标注需求;图片管理模块用于图片发布者查看待标注图片的标注进度,以及对图片进行管理;标注结果导出模块用于在图片标注完成判定模块判定图片标注完成后,图片发布者对标注完成的图片进行批量导出;所述图片初始标注模块用于对图片发布模块发布的待标注图片进行自动识别并初始标注;图片推荐模块用于将经图片初始标注模块初始标注过的图片有针对性的推送给具有专业背景或对应兴趣的众包志愿者;图片标注完成判定模块用于判定待标注图片是否标注完成并确定图片最终标注;用户积分及恶意判定模块用于计算众包志愿者的积分及判定众包志愿者是否进行恶意标注,并对恶意标注进行判罚;所述个人信息管理模块用于管理众包志愿者的基本信息、专业背景和兴趣;历史标注模块用于众包志愿者查看、删除、修改尚未被采纳的标签;图片搜索模块用于对待标注图片进行搜索,为当前众包志愿者提供符合要求的待标注图片;今日推荐模块用于众包志愿者查看图片推荐模块为其推荐的待标注图片;图片标注模块用于众包志愿者对待标注图片进行标注。2.根据权利要求1所述基于众包的图片标注系统,其特征在于,所述图片推荐模块的具体工作过程如下:(1)获取所有众包志愿者的信息构成集合personList={person1,person2,…,personn},personi表示第i个众包志愿者的信息,包括众包志愿者的专业、兴趣、信用值、积分、打过标签图片信息、历史标签信息,i=1,…,n,n为众包志愿者的数量;(2)获取经图片初始标注模块初始标注过的所有图片的信息构成集合pictureList={picture1,picture2,…,picturem},pictureu表示第u张图片的信息,包括图片路径、图片已有初始标签信息,u=1,…,m,m为待标注图片的数量;(3)对于personList中的每一个众包志愿者,进行基于众包志愿者的协同过滤,具体操作如下:A)判断当前众包志愿者是否具有专业背景或对应兴趣,若无则转(5),否则转B);B)根据专业、兴趣计算当前众包志愿者与personList中其他各众包志愿者的相似度,计算公式如下:其中,j=1,…,n,i≠j,Wij为当前第i个众包志愿者与第j个众包志愿者之间的相似度,β为专业相似度权重,N(·)为众包志愿者的专业集合,M(·)为众包志愿者的兴趣集合,crditj为第j个众包志愿者的积分;C)对B)得到的所有相似度从大到小进行排序,将相似度高的前s个众包志愿者打过标签的图片进行初步保留,形成中间结果集temp-result;(4)对中间结果集temp-result进行扩充,使中间结果集的数量达到值leastTempNum,按打过标签的图片进行优先扩充;(5)判断当前众包志愿者是否打过标签,若无则转(7),否则转(6)进行基于图片的协同过滤;(6)将当前众包志愿者打过的标签集合与中间结果集temp-result中各图片已被打上的标签集合进行相似度计算,对所有得到的相似度进行排序,将相似度高于预设阈值的图片保留下来作为最终结果集final-set进行推荐;所述相似度计算公式如下:其中,Sia为当前第i个众包志愿者与中间结果集temp-result中第a张...

【专利技术属性】
技术研发人员:刘凡张嘉韬毛莺池许峰
申请(专利权)人:河海大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1