【技术实现步骤摘要】
图片处理方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,特别涉及计算机视觉、自然语言处理、图片检索以及深度学习等领域的图片处理方法、装置、电子设备及存储介质。
技术介绍
[0002]在图片检索场景中,图片的文本描述起着不可或缺的作用,文本描述即指关于图片的一些文字性描述信息,文本描述可用于辅助进行图片检索,即可帮助对应的图片被正确检索到。
技术实现思路
[0003]本公开提供了图片处理方法、装置、电子设备及存储介质。
[0004]一种图片处理方法,包括:
[0005]获取数据库中的图片的图片向量,根据所述图片向量对所述数据库中的图片进行分组,同一分组中的图片为相同图片;
[0006]针对得到的分组,分别进行以下处理:利用所述分组中的图片对应的原始文本描述组成第一文本集,基于所述第一文本集中的原始文本描述的文本向量,从所述第一文本集中过滤掉确定出的低质文本描述,根据剩余的原始文本描述生成所述分组中的图片共同对应的文本描述。
[0007]一种图片处理装置,包 ...
【技术保护点】
【技术特征摘要】
1.一种图片处理方法,包括:获取数据库中的图片的图片向量,根据所述图片向量对所述数据库中的图片进行分组,同一分组中的图片为相同图片;针对得到的分组,分别进行以下处理:利用所述分组中的图片对应的原始文本描述组成第一文本集,基于所述第一文本集中的原始文本描述的文本向量,从所述第一文本集中过滤掉确定出的低质文本描述,根据剩余的原始文本描述生成所述分组中的图片共同对应的文本描述。2.根据权利要求1所述的方法,其中,所述根据所述图片向量对所述数据库中的图片进行分组包括:根据所述图片向量对所述数据库中的图片进行聚类,将不同的图片分别聚类到距离最近的聚类中心下;针对各聚类中心,分别进行以下处理:针对属于所述聚类中心的每张图片,分别获取其图片向量与属于所述聚类中心的其它各图片的图片向量之间的相似度;根据所述相似度对属于所述聚类中心的各图片进行分组,其中,同一分组中的任意两张图片之间的相似度均大于第一阈值。3.根据权利要求1所述的方法,还包括:所述基于所述第一文本集中的原始文本描述的文本向量,从所述第一文本集中过滤掉确定出的低质文本描述之前,对所述第一文本集中的原始文本描述进行去重处理。4.根据权利要求1所述的方法,其中,所述从所述第一文本集中过滤掉确定出的低质文本描述包括:对所述第一文本集中的各原始文本描述的文本向量进行聚类,根据聚类结果确定出离群点;将所述离群点对应的原始文本描述作为所述低质文本描述。5.根据权利要求1所述的方法,其中,所述从所述第一文本集中过滤掉确定出的低质文本描述包括:响应于确定所述第一文本集中的任一原始文本描述符合以下条件:所述原始文本描述的文本向量与所述原始文本描述对应的图片的图片向量之间的相似度小于第二阈值,将所述原始文本描述作为所述低质文本描述。6.根据权利要求1所述的方法,其中,所述根据剩余的原始文本描述生成所述分组中的图片共同对应的文本描述包括:利用剩余的原始文本描述组成第二文本集,并对所述第二文本集进行二次过滤处理,所述二次过滤处理包括:针对所述第二文本集中的任意两个内容重复率大于第三阈值的原始文本描述,删除其中的一个原始文本描述中的重复内容;将进行二次过滤处理后的所述第二文本集中的内容作为所述分组中的图片共同对应的文本描述。7.根据权利要求1~6中任一项所述的方法,还包括:在用户进行图片检索时,响应于确定任一分组中的图片被召回,将所述分组作为目标分组,从所述目标分组中的图片对应的网页中选出质量最优的网页,将所述质量最优的网页对应的图片及所述质量最优的网页作为检索结果返回给用户,其中,同一分组中的图片
分别来自于不同的网页。8.根据权利要求7所述的方法,其中,所述从所述目标分组中的图片对应的网页中选出质量最优的网页包括:针对各网页,分别进行以下处理:获取所述网页与对应的图片之间的相关性评分,并获取所述网页的权威性评分,根据所述相关性评分以及所述权威性评分确定出所述网页的质量评分;将所述质量评分最高的网页作为所述质量最优的网页。9.根据权利要求8所述的方法,其中,所述获取所述网页与对应的图片之间的相关性评分包括:获取所述网页对应的图片的图片向量与所述网页对应的图片的原始文本描述的文本向量之间的相似度,根据所述相似度确定出所述相关性评分,其中,所述相似度越大,所述相关性评分越高。10.根据权利要求8所述的方法,其中,所述获取所述网页的权威性评分包括:对所述目标分组中的图片对应的原始文本描述的文本向量进行聚类,获取所述网页对应的文本向量与聚类得到的聚类中心之间的距离,根据所述距离确定出权威性评分,其中,所述距离越近,所述权威性评分越高。11.根据权利要求8所述的方法,其中,所述据所述相关性评分以及所述权威性评分确定出所述网页的质量评分包括:获取所述相关性评分与所述权威性评分的相加之和,将得到的和作为所述质量评分。12.一种图片处理装置,包括:图片分组模块以及文本优化模块;所述图片分组模块,用于获取数据库中的图片的图片向量,根据所述图片向量对所述数据库中的图片进行分组,同一分组中的图片为相同图片;所述文本优化模块,用于针对...
【专利技术属性】
技术研发人员:洪椿祥,王光远,杨少宁,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。