业务数据处理方法及其系统技术方案

技术编号:17406945 阅读:52 留言:0更新日期:2018-03-07 04:49
本申请公开一种业务数据处理方法及其系统,其中所述方法包括:提取多个业务对象对应的图像的图像描述特征;根据所述图像描述特征在所述多个业务对象中确定图像相关的业务对象;提取所述图像相关的业务对象的文字说明信息,根据所述文字说明信息确定所述图像相关的业务对象的关键词;根据所述图像相关的业务对象的关键词确定业务类型相关的业务对象;确定所述业务类型相关的业务对象的描述信息。通过本申请能够提高数据挖掘结果的精度和召回率。

Business data processing method and its system

The invention discloses a business data processing method and a system thereof, wherein the method comprises the following steps: extracting image corresponding to a plurality of business object features; according to the description of the image features to determine the business object image correlation in the plurality of business objects; extracting the image related business object text information, according to the text information to determine the keywords business object image correlation; according to the image words related to the business object to determine the type of business related business objects; determine the description information of the type of business related business objects. This application can improve the accuracy and recall of data mining results.

【技术实现步骤摘要】
业务数据处理方法及其系统
本申请涉及计算机
,尤其涉及一种业务数据处理方法及其系统。
技术介绍
目前,电子商务平台包含有大量的(上亿)商品,这些商品的信息大都是由卖家用户自行编辑添加的。由于没有统一的标准,卖家所填写的商品标题、商品属性、细节描述等文字信息的正确性参差不齐,因此直接使用卖家提供的信息所得到的效果会很差;同时尝试利用这些信息所建立的同类商品关系图的准确度也较低。并且,由于现有的图像算法的局限,只使用图像信息所能构建出来的同类商品关系图的准确度高于基于文字建立的同类商品关系图,但是召回率也比较低。综上所述,基于现有技术中存在的商品等业务对象对应的信息不准确的问题,因此有必要提出改进的技术手段解决上述问题。
技术实现思路
本申请的主要目的在于提供一种业务数据处理方法及其系统,以解决现有技术中存在的上述的问题。为了解决上述问题,根据本申请实施例提供一种业务数据处理方法,其包括:提取多个业务对象对应的图像的图像描述特征;根据所述图像描述特征在所述多个业务对象中确定图像相关的业务对象;提取所述图像相关的业务对象的文字说明信息,根据所述文字说明信息确定所述图像相关的业务对象的关键本文档来自技高网...
业务数据处理方法及其系统

【技术保护点】
一种业务数据处理方法,其特征在于,包括:提取多个业务对象对应的图像的图像描述特征;根据所述图像描述特征在所述多个业务对象中确定图像相关的业务对象;提取所述图像相关的业务对象的文字说明信息,根据所述文字说明信息确定所述图像相关的业务对象的关键词;根据所述图像相关的业务对象的关键词确定业务类型相关的业务对象;确定所述业务类型相关的业务对象的描述信息。

【技术特征摘要】
1.一种业务数据处理方法,其特征在于,包括:提取多个业务对象对应的图像的图像描述特征;根据所述图像描述特征在所述多个业务对象中确定图像相关的业务对象;提取所述图像相关的业务对象的文字说明信息,根据所述文字说明信息确定所述图像相关的业务对象的关键词;根据所述图像相关的业务对象的关键词确定业务类型相关的业务对象;确定所述业务类型相关的业务对象的描述信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述图像描述特征在所述多个业务对象中确定图像相关的业务对象的步骤,包括:根据所述图像描述特征计算对应业务对象的图像相似度,将图像相似度大于预设阈值的业务对象确定为图像相关的业务对象。3.根据权利要求1所述的方法,其特征在于,所述根据所述文字说明信息确定所述图像相关的业务对象的关键词的步骤,包括:对所述文字说明信息进行分词处理,将分词处理得到的每个词分别与预设的关键词字典进行匹配得到关键词;统计关键词的出现频率,将出现频率大于预设阈值的关键词确定为所述图像相关的业务对象的关键词。4.根据权利要求1所述的方法,其特征在于,所述根据所述图像相关的业务对象的关键词确定业务类型相关的业务对象的步骤,包括:比较多个图像相关的业务对象的关键词的相似度,将该相似度大于预设阈值的业务对象确定为业务类型相关的业务对象。5.根据权利要求1所述的方法,其特征在于,所述业务对象的描述信息包括:文字描述信息;所述确定所述业务类型相关的业务对象的描述信息的步骤,包括:统计所述业务类型相关的业务对象的关键词的出现频率,将出现频率大于预设阈值的关键词确定为所述业务类型相关的业务对象的文字描述信息。6.根据权利要求1所述的方法,其特征在于,所述业务对象的描述信息包括:图像描述信息;所述确定所述业务类型相关的业务对象的描述信息的步骤,包括:提取所述业务类型相关的业务对象对应的图像的图像描述特征;根据所述图像描述特征计算对应业务对象的图像相似度,将图像相似度大于预设阈值的图像确定为所述业务类型相关的业务对象的图像描述信息。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述图像描述特征包括:SIFT特征、CNN特征、SURF特征、颜色特征、纹理直...

【专利技术属性】
技术研发人员:孙修宇李昊华先胜
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1