【技术实现步骤摘要】
一种面向电商平台的商品图像大数据精准推送方法及系统
[0001]本专利技术涉及数据处理
,具体而言,涉及一种面向电商平台的商品图像大数据精准推送方法及系统。
技术介绍
[0002]随着互联网技术的高速发展,智能电商越来越得到消费者的认可,给商家和消费者都提供了更方便的交易平台。商家可以利用电商平台更好地销售商品,消费者可以利用电商平台更好地对比和挑选商品。然而,海量的商品图像也成为了一种负担,由于商品图像数量过于庞大,消费者往往无法精准地浏览和挑选自己感兴趣的商品图像。
[0003]传统的图像检索方法虽然能够为消费者检索及推荐部分高质量商品图像,但这些方法往往无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐。
技术实现思路
[0004]为了克服上述问题或者至少部分地解决上述问题,本专利技术实施例提供一种面向电商平台的商品图像大数据精准推送方法及系统,利用多尺度信噪比检测、显著性区域信噪比检测的方法对部分低质量的商品图像进行排除,在此基础上,利用基于OCR技术的高频词汇匹配方法 ...
【技术保护点】
【技术特征摘要】
1.一种面向电商平台的商品图像大数据精准推送方法,其特征在于,包括以下步骤:获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。2.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定低质量图像的方法包括以下步骤:获取并对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重建,以得到多个尺度下的商品图像;检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像;获取并对电商平台的商品图像数据集中的任意一副商品图像进行显著性检测,以得到商品显著性区域图像;检测并根据商品显著性区域图像的峰值信噪比确定低质量图像。3.根据权利要求2所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像的方法包括以下步骤:计算各个尺度下的商品图像的峰值信噪比,以得到多个尺度下的图像峰值信噪比;判断各个尺度下的图像峰值信噪比是否小于预置的峰值信噪比阈值,若至少一个尺度下的图像峰值信噪比小于峰值信噪比阈值,则将该商品图像确定为低质量图像。4.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述利用OCR技术对优化图像中的词汇进行识别,得到并统计高频词汇的方法包括以下步骤:利用OCR技术对优化图像中的词汇进行识别,以得到词汇识别结果;统计词汇识别结果中的各个词汇出现的次数,生成各个词汇的统计结果;判断各个词汇的统计结果是否超出预置的高频次数阈值,如果是,则将对应词汇标注为高频词汇。
5.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户的方法包括以下步骤:根据聚类结果中的与正样本聚为一类信...
【专利技术属性】
技术研发人员:袁道红,
申请(专利权)人:北京嘉沐安科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。