一种多模态融合的商品分类系统技术方案

技术编号：15747425 阅读：136 留言：0更新日期：2017-07-03 04:51

本发明专利技术提供了一种多模态融合的商品分类系统，包括基于图像的商品分类模块、基于文本的商品分类模块和图文融合分类模块；所述基于图像的商品分类模块用于获取商品图像的分类结果；所述基于文本的商品分类模块用于获取商品文本的分类结果；所述图文融合分类模块用于融合基于商品图像的分类结果和基于商品文本的分类结果，得到并输出商品类别。本发明专利技术的有益效果为：能够实现较为精确和快速的商品分类。

A multimodal classification system for goods

The invention provides a multi-modal fusion system based on the classification of goods, including goods classification module, commodity classification module based on image text and graphic fusion classification module; the commodity classification module based on image classification results for image acquisition of goods; the commodity classification module based on the text for text classification results to obtain goods; the graphic module is used for fusion classification based on image fusion and classification results of commodity and commodity based on the classification results of the text, and the output of commodity categories. The invention has the advantages that the goods classification can be realized more accurately and quickly.

全部详细技术资料下载

【技术实现步骤摘要】
一种多模态融合的商品分类系统
本专利技术涉及商品分类
，具体涉及一种多模态融合的商品分类系统。
技术介绍
商品分类为商品检索、商品置放策略制定以及智能推荐等提供了有力支撑。图像作为商品的主要信息载体，基于图像的商品分类技术研究己成为图像处理、计算机视觉和模式识别领域的研究热点。然而，现有的商品分类方法仅对商品的图像进行研究而忽略了商品的文本信息，另一方面，现有的商品分类方法存在分类准确率低、分类速度慢等问题。
技术实现思路
针对上述问题，本专利技术旨在提供一种多模态融合的商品分类系统。本专利技术的目的采用以下技术方案来实现：提供了一种多模态融合的商品分类系统，包括基于图像的商品分类模块、基于文本的商品分类模块和图文融合分类模块；所述基于图像的商品分类模块用于获取商品图像的分类结果；所述基于文本的商品分类模块用于获取商品文本的分类结果；所述图文融合分类模块用于融合基于商品图像的分类结果和基于商品文本的分类结果，得到并输出商品类别。本专利技术的有益效果为：能够实现较为精确和快速的商品分类。附图说明利用附图对本专利技术作进一步说明，但附图中的实施例不构成对本专利技术的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。图1是本专利技术的结构连接示意图；附图标记：基于图像的商品分类模块1、基于文本的商品分类模块2、图文融合分类模块3、商品分类准确度评价模块4。具体实施方式结合以下实施例对本专利技术作进一步描述。参见图1，本实施例的一种多模态融合的商品分类系统，包括基于图像的商品分类模块1、基于文本的商品分类模块2和图...

【技术保护点】
一种多模态融合的商品分类系统，其特征是：包括基于图像的商品分类模块、基于文本的商品分类模块和图文融合分类模块，所述基于图像的商品分类模块用于获取商品图像的分类结果；所述基于文本的商品分类模块用于获取商品文本的分类结果；所述图文融合分类模块用于融合基于商品图像的分类结果和基于商品文本的分类结果，得到并输出商品类别。

【技术特征摘要】
1.一种多模态融合的商品分类系统，其特征是：包括基于图像的商品分类模块、基于文本的商品分类模块和图文融合分类模块，所述基于图像的商品分类模块用于获取商品图像的分类结果；所述基于文本的商品分类模块用于获取商品文本的分类结果；所述图文融合分类模块用于融合基于商品图像的分类结果和基于商品文本的分类结果，得到并输出商品类别。2.根据权利要求1所述的一种多模态融合的商品分类系统，其特征是：所述基于图像的商品分类模块用于获取商品图像的分类结果，具体为：(1)对需分类的商品图像进行图像去噪处理，包括：1)进行需分类的商品图像的光照归一化处理，采用以下方式进行：将需分类的商品图像P转换到对数域，利用差分高斯滤波器对需分类的商品图像P进行平滑处理，然后对需分类的商品图像P进行全局对比度均衡化处理；2)对需分类的商品图像P以滑动窗口方式按照预先设定的滑动距离进行块划分；3)提取得到的图像块中的每一块的纹理特征，采用K-MEANS聚类方法基于提取的纹理特征对图像块进行聚类，获得多个图像块组，利用多线性子空间学习滤波器对图像块组进行初次去噪；4)采用改进的自适应字典学习去噪方法对初次去噪后的需分类的商品图像进行二次去噪。(2)获取商品的图像分类结果和图像分类得分。3.根据权利要求2所述的一种多模态融合的商品分类系统，其特征是：所述采用改进的自适应字典学习去噪方法对初次去噪后的需分类的商品图像进行二次去噪，具体包括：(1)对初次去噪后的图像块进行重排列形成列向量矩阵，并对列向量矩阵进行降维，最终形成样本块集合{P}；(2)对该样本块集合进行自适应字典训练，得到自适应学习字典D；(3)对该需分类的商品图像P按照另一设定的滑动距离再次进行滑动窗口的块划分，对得到的图像块进行重排列形成列向量矩阵，并对列向量矩阵进行降维，最终形成输入图像块集合{P′}；(4)求解输入图像块集合{P′}中每一列向量在自适应学习字典上的稀疏表示稀疏μ，并按照下式计算输出图像块y(P)：y(P)＝Dμ(5)将输出图像块进行融合处理，得到预去噪图像y′(P)；(6)对预去噪图像y′(P)进行低秩矩阵稀疏分解，得到低秩去噪分量DZ和稀疏含噪分量XS，对该低秩去噪分量DZ和稀疏含噪分量XS进行二次去噪处理，得到最终去噪图像：y″(P)＝DZ*XS′式中，XS′表示对稀疏含噪分量XS进行中值滤波后得到的稀疏去噪分量，*表示融合处理。4.根据权利要求3所述的一种多模态融合的商品分类系统，其特征是：所述获取商品的图像分类结果和图像分类得分具体为：将第j类商品图像的训练样本集表示为Fj＝[fj，1，fj，2，…，fj，n]，则所有类别的训练样本集F＝[F1，F2，…，FN]构成过完备字典，其中，N表示商品类别数，对于未知类别测试样本t，可表示为F的线性组合：t＝Fa式中，a为稀疏的系数向量，用稀疏编码算法求得稀疏表示a；定义函数ρj(a)，该函...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：深圳明创自控技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人