货品属性填充方法及装置、存储介质及电子终端制造方法及图纸

技术编号:21893820 阅读:28 留言:0更新日期:2019-08-17 15:15
本公开涉及计算机技术领域,具体涉及一种货品属性填充方法、一种货品属性填充装置、一种存储介质以及一种电子终端。所述方法包括:从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据;获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵;利用机器学习算法对所述基础数据进行训练并生成分类器模型;利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值,并根据所述属性值对所述待填写货品进行属性值自动填写。本公开能够利用部分典型货品的完整货品属性值训练分类器模型,使分类器模型可以适应各货品的不同属性,进而保证货品属性填充的准确率。

Attribute Filling Method and Device, Storage Medium and Electronic Terminal for Goods

【技术实现步骤摘要】
货品属性填充方法及装置、存储介质及电子终端
本公开涉及计算机
,具体涉及一种货品属性填充方法、一种货品属性填充装置、一种存储介质以及一种电子终端。
技术介绍
对电商平台而言,在对商品或货品进行分类、管理,或者用户对商品或货品进行筛选时,都可以根据其属性信息来操作,货品属性信息的管理变得至关重要。举例来说,货品的属性信息可以包括:显示器的尺寸、品牌及产地;衬衫的颜色、款式、尺码及质地等等。除货品的常规属性信息外,当增加新货品时,也有可能会增加新的属性信息。传统方法在对货品进行属性填写时,需要利用人工的方式对货品的各项基本属性进行填写。但这样的方式仅适用于货品数量较少时;当货品达到一定的数量级,则人工填写货品属性的时间成本及人工成本就会变得巨大,并且工作效率较低。虽然现有的方案中存在一些填充算法可以实现对货品属性的自动填充,但仍存在一定的缺陷。例如,现有的填充算法需要根据货品的不同属性分别设计不同的填充规则,不具有普适性,并且填充率并不能得到有效的保证。举例来说,对于“屏幕尺寸”属性,需要提前设定对应的值域,如{4寸、4.5寸、4.8寸、5.2寸……}。当出现新的屏幕尺寸“5.9寸”,若未提前在值域内设置该“5.9寸”,则无法填充该屏幕尺寸值。对于颜色属性,如产品信息为“红辣椒华彩手机,黑色,5寸”,则对于“颜色”属性,由于产品信息中存在多个与“颜色”属性相关的关键词,使得填充算法并不一定能准确获取“黑色”的属性值,可能出现误配的情况。同时,对于经过填充算法自动填充后仍未能填写的货品属性,依然需要人工方式进行填写,使得填充率降低,从而降低了填写效率。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种货品属性填充方法、一种货品属性填充装置、一种存储介质以及一种电子终端,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的第一方面,提供一种货品属性填充方法,包括:从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据;获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵;利用机器学习算法对所述基础数据进行训练并生成分类器模型;利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值,并根据所述属性值对所述待填写货品进行属性值自动填写。在本公开的一种示例性实施例中,所述从待填写货品中获取典型货品包括:获取待填写货品并根据所述待填写货品的描述信息提取特征字段;依据提取的所述特征字段对所述待填写货品进行聚类;在聚类结果的每一类中随机抽取一个或多个所述待填写货品作为典型货品。在本公开的一种示例性实施例中,所述根据所述待填写货品的描述信息提取特征字段包括:对所述待填写货品的描述信息进行分词处理;根据所述分词处理后得到的分词利用word2vec模型提取各所述待填写货品的特征字段。在本公开的一种示例性实施例中,在根据所述待填写货品的描述信息生成特征矩阵时,所述方法还包括:判断是否接收到一填写数量m;在判断接收到所述填写数量m时,将所述待填写货品聚类的类别数量设置为m;其中,m>0。在本公开的一种示例性实施例中,所述根据所述待填写货品的描述信息生成特征矩阵包括:对所述待填写货品的描述信息进行分词处理以获取分词;利用预设模型对获取的所述分词进行特征字段提取;对提取的所述特征字段分别进行向量化处理、稀疏化处理以生成特征矩阵。在本公开的一种示例性实施例中,所述利用机器学习算法对所述基础数据进行训练并生成分类器模型包括:利用n种机器学习算法分别对所述基础数据进行训练并获取对应的n个分类器模型;其中,n>0;通过交叉验证评估各所述分类器模型对所述待填写货品属性的属性值填写的准确率;根据各所述分类器模型对于所述各属性值填写的准确率计算各所述分类器模型对所述待填写货品的属性填写的权重;其中,其中,wc为分类器模型c的权重;n为分类器模型的数量;accuracycv为经交叉验证获取的准确率。在本公开的一种示例性实施例中,所述利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值包括:根据各所述分类器模型对所述待填写货品各属性填写的权重选择分类器模型的输出结果作为所述待填写货品的属性值。在本公开的一种示例性实施例中,所述方法还包括:利用一自动字典模型根据所述基础数据及各所述待填写货品的描述信息计算所述基础数据中各属性值与各所述待填写货品之间的关系分数;根据所述自动字典模型计算的所述关系分数及所述n个分类器模型的权重计算所述待填写货品当前属性对应属性值的信心得分S:其中,C为分类器模型的集合;fc(i)∈{0,1},表示该分类器模型c对当前待填写货品是否填写属性值;wc∈[0,1],表示该分类器c当前一次填写属性值的权重;D(i)∈[0,1],表示所述自动字典模型计算的关系分数;wd∈[0,1],表示所述自动字典模型的权重;判断所述待填写货品当前属性的信心得分是否大于一预设准确率;在判断所述信心得分大于所述准确率时输出所述当前属性的属性值。在本公开的一种示例性实施例中,所述方法还包括:将输出的所述属性值增加至所述基础数据。在本公开的一种示例性实施例中,所述方法还包括:在判断所述待填写货品当前属性的信心得分小于预设准确率时,将该待填写货品保留并等待下一次属性填充。在本公开的一种示例性实施例中,所述利用一自动字典模型根据所述基础数据及各所述待填写货品的描述信息计算所述基础数据中各属性值与各所述待填写货品之间的关系分数包括:根据所述基础数据建立各属性对应的现有属性值域;对所述现有属性值域中的元素利用jieba分词模型进行分词处理以便于获取第一分词集;对所述元素按第一预设规则进行拆分及过滤以便于获取第二分词列表;将所述第一分词集与所述第二分词列表按第二预设规则合并及过滤以便于获取第三分词集;将所述元素与所述第三分词集建立映射关系表;遍历所述属性值域各元素并将各元素建立对应的映射关系添加至所述映射关系表中;根据所述待填写货品描述信息中的特征字段在所述映射关系表中查找并生成预测结果。在本公开的一种示例性实施例中,所述机器学习算法包括:支持向量机算法、多项式朴素贝叶斯算法、多层感知机算法、随机森林算法以及K-最近邻算法中的任意一种或多种。在本公开的一种示例性实施例中,所述货品的单位为商品、单品或SKU。根据本公开的第二方面,提供一种货品属性填充装置,包括:典型数据获取模块,用于从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据;特征矩阵生成模块,用于获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵;分类器模型生成模块,用于利用机器学习算法对所述基础数据进行训练并生成分类器模型;属性填写执行模块,用于利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值,并根据所述属性值对所述待填写货品进行属性值自动填写。根据本公开的第三方面,提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的货品属性填充方法。根据本本文档来自技高网
...

【技术保护点】
1.一种货品属性填充方法,其特征在于,包括:从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据;获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵;利用机器学习算法对所述基础数据进行训练并生成分类器模型;利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值,并根据所述属性值对所述待填写货品进行属性值自动填写。

【技术特征摘要】
1.一种货品属性填充方法,其特征在于,包括:从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据;获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵;利用机器学习算法对所述基础数据进行训练并生成分类器模型;利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值,并根据所述属性值对所述待填写货品进行属性值自动填写。2.根据权利要求1所述的货品属性填充方法,其特征在于,所述从待填写货品中获取典型货品包括:获取待填写货品并根据所述待填写货品的描述信息提取特征字段;依据提取的所述特征字段对所述待填写货品进行聚类;在聚类结果的每一类中随机抽取一个或多个所述待填写货品作为典型货品。3.根据权利要求2所述的货品属性填充方法,其特征在于,所述根据所述待填写货品的描述信息提取特征字段包括:对所述待填写货品的描述信息进行分词处理;根据所述分词处理后得到的分词利用word2vec模型提取各所述待填写货品的特征字段。4.根据权利要求2所述的货品属性填充方法,其特征在于,在根据所述待填写货品的描述信息生成特征矩阵时,所述方法还包括:判断是否接收到一填写数量m;在判断接收到所述填写数量m时,将所述待填写货品聚类的类别数量设置为m;其中,m>0。5.根据权利要求1所述的货品属性填充方法,其特征在于,所述根据所述待填写货品的描述信息生成特征矩阵包括:对所述待填写货品的描述信息进行分词处理以获取分词;利用预设模型对获取的所述分词进行特征字段提取;对提取的所述特征字段分别进行向量化处理、稀疏化处理以生成特征矩阵。6.根据权利要求1所述的货品属性填充方法,其特征在于,所述利用机器学习算法对所述基础数据进行训练并生成分类器模型包括:利用n种机器学习算法分别对所述基础数据进行训练并获取对应的n个分类器模型;其中,n>0;通过交叉验证评估各所述分类器模型对所述待填写货品属性的属性值填写的准确率;根据各所述分类器模型对于所述属性值填写的准确率计算各所述分类器模型对所述待填写货品的属性填写的权重;其中,其中,wc为分类器模型c的权重;n为分类器模型的数量;accuracycv为经交叉验证获取的准确率。7.根据权利要求6所述的货品属性填充方法,其特征在于,所述利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值包括:根据各所述分类器模型对所述待填写货品各属性填写的权重选择分类器模型的输出结果作为所述待填写货品的属性值。8.根据权利要求6所述的货品属性填充方法,其特征在于,所述方法还包括:利用一自动字典模型根据所述基础数据及各所述待填写货品的描述信息计算所述基础数据中各属性值与各所述待填写货品之间的关系分数;根据所述自动字典模型计算的所述关系分数及所述n个分类器模型的权重计算所述待填写货品当前属性对应属性值的信心得分S:其中,C为分类器模型的集合;fc(i)∈{0,1},表示该分类器模型c对当前待填写货品是否填写属性值;wc∈...

【专利技术属性】
技术研发人员:刘寅亮
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1