一种图片识别方法及装置制造方法及图纸

技术编号:26171346 阅读:21 留言:0更新日期:2020-10-31 13:43
本发明专利技术公开了一种图片识别方法,包括:获取目标图片;对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,所述多个网页页面文本的来源各不相同;对所述多个网页页面文本进行实体词抽取,获得多个实体词;基于文图相关性对所述多个实体词进行排序,获得排序结果,其中,所述文图相关性是指所述实体词与所述目标图片的相关性;基于所述排序结果获得所述目标图片的识别结果,并输出所述识别结果。本发明专利技术可以提高图片识别的准确率。同时,本发明专利技术还公开了一种图片识别装置。

An image recognition method and device

【技术实现步骤摘要】
一种图片识别方法及装置
本专利技术涉及互联网
,尤其涉及一种图片识别方法及装置。
技术介绍
图片搜索技术可以实现对图片的搜索,搜索获得与搜索实体词相关的图片,还可以识别出图片中的内容。例如:图片中的人具体是谁,图片中的物体是什么物体,图片中的风景的所属位置,等等,这也常被叫做“看图猜词”。但是,目前在基于图片搜索技术进行图片识别时,普遍存在识别准确率低的技术问题。
技术实现思路
本申请实施例通过提供一种图片识别方法及装置,解决了现有技术中在进行图片识别时,存在识别准确率低的技术问题,实现了提高识别准确率的技术效果。第一方面,本申请通过本申请的一实施例提供如下技术方案:一种图片识别方法,包括:获取目标图片;对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,所述多个网页页面文本的来源各不相同;对所述多个网页页面文本进行实体词抽取,获得多个实体词;基于文图相关性对所述多个实体词进行排序,获得排序结果,其中,所述文图相关性是指所述实体词与所述目标图片的相关性;基于所述排序结果获得所述目标图片的识别结果,并输出所述识别结果。优选地,所述对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,包括:利用图片搜索引擎对所述目标图片进行搜索,获得分布在全网中的与所述目标图片相同或相似的多张图片,所述多张图片所在的网页各不相同;从所述多张图片中的每张图片所在的网页上,提取所述多张图片中的每张图片的描述信息,并将所述描述信息作为所述网页页面文本。优选地,所述对所述多个网页页面文本进行实体词抽取,获得多个实体词,包括:基于预先构建的实体词库,对所述多个网页页面文本中的每个网页页面文本进行实体词抽取,获得多个实体词。优选地,所述基于预先构建的实体词库,对所述多个网页页面文本中的每个网页页面文本进行实体词抽取,获得多个实体词,包括:对所述多个网页页面文本中的每个网页页面文本进行分词,获得M个分词,所述M个分词各不相同,M为正整数;在所述实体词库中查找所述M个分词中的每个分词,并将查找到的分词作为所述实体词;和/或对所述多个网页页面文本中的每个网页页面文本进行分词,获得M个分词,所述M个分词各不相同,M为正整数;基于预设策略,对所述M个分词进行重组,获得N个重组词,N为正整数;在所述实体词库中查找所述M个分词中的每个分词,以及查找所述N个重组词中的每个重组词,并将查找到的分词和重组词作为所述实体词。优选地,所述基于文图相关性对所述多个实体词进行排序,获得排序结果,包括:获取每个实体词的特征信息;将所述特征信息输入到LambdaMART排序模型,获得所述排序结果;其中,所述LambdaMART排序模型用于基于所述特征信息计算每个实体词与所述图片内容的匹配概率,并按照匹配概率从高到低的顺序对所述多个实体词进行排序,输出排序结果。优选地,所述基于所述排序结果获得所述目标图片的识别结果,包括:从所述排序结果中选出排序靠前Q个实体词,Q为正整数,并将所述Q个实体词作为所述目标图片的识别结果。第二方面,本申请通过本申请的一实施例提供如下技术方案:一种图片识别装置,包括:获取单元,用于获取目标图片;搜索单元,用于对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,所述多个网页页面文本的来源各不相同;抽取单元,用于对所述多个网页页面文本进行实体词抽取,获得多个实体词;排序单元,用于基于文图相关性对所述多个实体词进行排序,获得排序结果,其中,所述文图相关性是指所述实体词与所述目标图片的相关性;获得单元,用于基于所述排序结果获得所述目标图片的识别结果;输出单元,用于输出所述识别结果。优选地,所述搜索单元,具体用于:利用图片搜索引擎对所述目标图片进行搜索,获得分布在全网中的与所述目标图片相同或相似的多张图片,所述多张图片所在的网页各不相同;从所述多张图片中的每张图片所在的网页上,提取所述多张图片中的每张图片的描述信息,并将所述描述信息作为所述网页页面文本。优选地,所述抽取单元,具体用于:基于预先构建的实体词库,对所述多个网页页面文本中的每个网页页面文本进行实体词抽取,获得多个实体词。优选地,所述抽取单元,具体用于:对所述多个网页页面文本中的每个网页页面文本进行分词,获得M个分词,所述M个分词各不相同,M为正整数;在所述实体词库中查找所述M个分词中的每个分词,并将查找到的分词作为所述实体词;和/或对所述多个网页页面文本中的每个网页页面文本进行分词,获得M个分词,所述M个分词各不相同,M为正整数;基于预设策略,对所述M个分词进行重组,获得N个重组词,N为正整数;在所述实体词库中查找所述M个分词中的每个分词,以及查找所述N个重组词中的每个重组词,并将查找到的分词和重组词作为所述实体词。优选地,所述排序单元,具体用于:获取每个实体词的特征信息;将所述特征信息输入到LambdaMART排序模型,获得所述排序结果;其中,所述LambdaMART排序模型用于基于所述特征信息计算每个实体词与所述图片内容的匹配概率,并按照匹配概率从高到低的顺序对所述多个实体词进行排序,输出排序结果。优选地,所述获得单元,具体用于:从所述排序结果中选出排序靠前Q个实体词,Q为正整数,并将所述Q个实体词作为所述目标图片的识别结果。第三方面,本申请通过本申请的一实施例提供如下技术方案:一种图片识别装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时可以实现上述第一方面中的任一方法步骤。第四方面,本申请通过本申请的一实施例提供如下技术方案:一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可以实现上述第一方面中的任一方法步骤。本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:在本申请实施例中,公开了一种图片识别方法,包括:获取目标图片;对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,所述多个网页页面文本的来源各不相同;对所述多个网页页面文本进行实体词抽取,获得多个实体词;基于文图相关性对所述多个实体词进行排序,获得排序结果,其中,所述文图相关性是指所述实体词与所述目标图片的相关性;基于所述排序结果获得所述目标图片的识别结果,并输出所述识别结果。由于采用了对多个不同来源的网页页面文本进行实体词抽取,在数据层面对目标图片进行特征增广,以提高图像理解和识别的准确率,故而解决了现有技术中在进行图片识别时,存在识别准确率低的技术问题,实现了提高识别准确率的技术效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的本文档来自技高网...

【技术保护点】
1.一种图片识别方法,其特征在于,包括:/n获取目标图片;/n对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,所述多个网页页面文本的来源各不相同;/n对所述多个网页页面文本进行实体词抽取,获得多个实体词;/n基于文图相关性对所述多个实体词进行排序,获得排序结果,其中,所述文图相关性是指所述实体词与所述目标图片的相关性;/n基于所述排序结果获得所述目标图片的识别结果,并输出所述识别结果。/n

【技术特征摘要】
1.一种图片识别方法,其特征在于,包括:
获取目标图片;
对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,所述多个网页页面文本的来源各不相同;
对所述多个网页页面文本进行实体词抽取,获得多个实体词;
基于文图相关性对所述多个实体词进行排序,获得排序结果,其中,所述文图相关性是指所述实体词与所述目标图片的相关性;
基于所述排序结果获得所述目标图片的识别结果,并输出所述识别结果。


2.如权利要求1所述的方法,其特征在于,所述对所述目标图片进行网络搜索,获得所述目标图片分布在网络中的多个网页页面文本,包括:
利用图片搜索引擎对所述目标图片进行搜索,获得分布在全网中的与所述目标图片相同或相似的多张图片,所述多张图片所在的网页各不相同;
从所述多张图片中的每张图片所在的网页上,提取所述多张图片中的每张图片的描述信息,并将所述描述信息作为所述网页页面文本。


3.如权利要求1所述的方法,其特征在于,所述对所述多个网页页面文本进行实体词抽取,获得多个实体词,包括:
基于预先构建的实体词库,对所述多个网页页面文本中的每个网页页面文本进行实体词抽取,获得多个实体词。


4.如权利要求3所述的方法,其特征在于,所述基于预先构建的实体词库,对所述多个网页页面文本中的每个网页页面文本进行实体词抽取,获得多个实体词,包括:
对所述多个网页页面文本中的每个网页页面文本进行分词,获得M个分词,所述M个分词各不相同,M为正整数;在所述实体词库中查找所述M个分词中的每个分词,并将查找到的分词作为所述实体词;和/或
对所述多个网页页面文本中的每个网页页面文本进行分词,获得M个分词,所述M个分词各不相同;基于预设策略,对所述M个分词进行重组,获得N个重组词,N为正整数;在所述实体词库中查找所述M个分词中的每个分词,以及查找所述N个重组词中的每个重组词,并将查找到的分词和重组词作为所述实体词。


5.如权利要求1所述的方法,其特征在于,所述基于文...

【专利技术属性】
技术研发人员:潘达谢泽华周泽南苏雪峰许静芳
申请(专利权)人:搜狗杭州智能科技有限公司北京搜狗科技发展有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1