【技术实现步骤摘要】
基于深度学习的社交网络头像比对的分布式检测系统、方法、装置、处理器及其存储介质
[0001]本专利技术涉及深度学习
,尤其涉及多媒体图像检索、图像侦察
,具体是 指一种基于深度学习的社交网络头像比对的分布式检测系统、方法、装置、处理器及其计算 机可读存储介质。
技术介绍
[0002]随着社交媒体网络的兴起,人们越来越倾向于在社交网络媒体上发布自己的最新动态、 表达自己的意愿等。人们比以前更多地使用图片等多媒体进行信息分享,图片在传递信息中 发挥着更加重要的作用。社交媒体网络中的头像则是标明个人身份及立场的显著标记。通过 头像检索比对能够发现对某一话题感兴趣的同类人群甚至马甲用户,也能帮助对特定事件进 行追踪溯源。如何高效地从海量头像中检索出符合用户需求地图片,已经成为信息检索和计 算机视觉领域重要的研究课题。
[0003]基于深度学习卷积神经网络的特征学习在图像分类、目标检测等领域取得了广泛的成功, 成为新的研究重点和热点。卷积神经网络可以基于大量的图像数据自动学习图像特征,并且 由于卷积神经网络的深度结 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的社交网络头像比对的分布式检测系统,其特征在于,所述的系统包括:头像采集存储功能模块,用于从互联网上采集社交网络中特定用户的头像图片和基本信息,并将相应的信息进行存储;头像相似度训练功能模块,与所述的头像采集存储功能模块相连接,用于对采集到的所述的头像图片进行基于深度学习的特征向量提取和基于局部敏感哈希算法的从高维向量到低维向量的转换,并构建头像图片的分布式特征向量索引库;以及头像实时搜索功能模块,与所述的头像相似度训练功能模块相连接,用于对从所述的头像采集功能模块输入的头像进行特征值计算,并利用近似近邻算法在所述的分布式特征向量索引库中计算最相似的各个头像图片,并将所有的计算结果进行合并得到整体的相似头像图片和社交网络用户ID。2.根据权利要求1所述的基于深度学习的社交网络头像比对的分布式检测系统,其特征在于,所述的头像采集存储功能模块,具体包括:头像采集单元,用于采用网络数据爬虫从互联网对社交网络中特定用户的头像图片和基本信息进行数据采集;头像存储单元,用于将所述的头像采集单元采集到的头像图片存储在本地,并使用所述的头像图片的MD5哈希码作为头像图片的唯一标识码,将采集到的所述的特定用户的基本信息存储到键值对应的头像图片数据库中;以及所述的头像图片数据库,用于存储所述的特定用户的社交网络用户ID、头像图片的本地存储位置及头像图片的唯一标识码的信息。3.根据权利要求2所述的基于深度学习的社交网络头像比对的分布式检测系统,其特征在于,所述的头像相似度训练功能模块,具体包括:头像预处理单元,与所述的头像存储单元相连接,用于对采集到的所述的特定用户的头像图片进行归一化处理;深度学习特征向量提取单元,与所述的头像预处理单元相连接,用于对输入至所述的头像预处理单元处理的所述的头像图片使用VGG16神经网络模型进行特征向量的提取;局部敏感哈希处理单元,与所述的深度学习特征向量提取单元相连接,用于对所述的深度学习特征向量提取单元提取到的所述的头像图片的特征向量进行局部敏感特征哈希值处理,得到所述的头像图片的二进制哈希码;以及分布式头像特征向量索引库,与所述的局部敏感哈希处理单元单元相连接,通过随机选择任意一台节点,用于将所述的头像图片的唯一标识码和二进制哈希码进行存储。4.根据权利要求3所述的基于深度学习的社交网络头像比对的分布式检测系统,其特征在于,所述的头像实时搜索功能模块,具体包括:头像输入单元,与所述的头像预处理单元相连接,用于将待检测的头像图片依序输入至所述的头像相似度训练功能模块中的头像预处理单元、深度学习特征向量提取单元及局部敏感哈希处理单元进行相应的所述的头像图片的特征值计算处理,得到所述的待检测的头像图片的二进制哈希码;头像特征表示单元,用于将所述的头像输入单元处理后得到的所述的头像图片进行特征值表示;
相似头像图片计算单元,分别与所述的分布式头像特征向量索引库和头像特征表示单元相连接,基于所述的头像特征表示单元获取的头像图片的特征值,用于采用近似近邻算法计算所述的分布式特征向量索引库中最相似的各个头像图片的特征值;以及相似用户检测单元,分别与所述的头像图片数据库和相似头像图片计算单元相连接,用于将所述的相似头像图片计算单元计算所得的所有结果进行归并排序,从而得到整体最相似的若干张头像图片,并根据各个头像图片的唯一标识码从所述的头像图片数据库查询对应的社交网络用户ID。5.一种利用权利要求1所述的系统实现基于深度学习的社交网络头像比对的分布式检测方法,其特征在于,所述的方法具体包括以下步骤:(1)所述的头像采集功能模块使用多线程或者多进程的并发方式对社交网络中特定用户的头像图片进行持续采集,并记录下社交网络用户ID、头像图片的存储位置和头像图片数据的唯一标识码之间的对应关系;(2)所述的头像相似度训练功能模块使用基于ImageNet图像库训练的VGG16神经网络模型,对所述的头像采集功能模块的采集到的头像图片进行特征值提取得到512维的特征向量,利用所述的局部敏感哈希算法将该特征向量映射得到二进制哈希码,并连同该头像图片的唯一标识码,随机存储到任意一台分布式节点上;(3)所述的头像相似度训练功能模块还使用多个节点构建分布式社交网络中的用户头像图片的分布式头像特征向量索引库,以负载均衡的方式分担头像检索的压力;(4)所述的头像实时搜索功能模块对输入的头像图片使用所述的步骤...
【专利技术属性】
技术研发人员:姚伟,王永剑,王婷,李超,
申请(专利权)人:公安部第三研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。