货品属性填充方法及装置、存储介质及电子终端制造方法及图纸

技术编号：21893820 阅读：28 留言：0更新日期：2019-08-17 15:15

本公开涉及计算机技术领域，具体涉及一种货品属性填充方法、一种货品属性填充装置、一种存储介质以及一种电子终端。所述方法包括：从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据；获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵；利用机器学习算法对所述基础数据进行训练并生成分类器模型；利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值，并根据所述属性值对所述待填写货品进行属性值自动填写。本公开能够利用部分典型货品的完整货品属性值训练分类器模型，使分类器模型可以适应各货品的不同属性，进而保证货品属性填充的准确率。

Attribute Filling Method and Device, Storage Medium and Electronic Terminal for Goods

全部详细技术资料下载

【技术实现步骤摘要】
货品属性填充方法及装置、存储介质及电子终端
本公开涉及计算机
，具体涉及一种货品属性填充方法、一种货品属性填充装置、一种存储介质以及一种电子终端。
技术介绍
对电商平台而言，在对商品或货品进行分类、管理，或者用户对商品或货品进行筛选时，都可以根据其属性信息来操作，货品属性信息的管理变得至关重要。举例来说，货品的属性信息可以包括：显示器的尺寸、品牌及产地；衬衫的颜色、款式、尺码及质地等等。除货品的常规属性信息外，当增加新货品时，也有可能会增加新的属性信息。传统方法在对货品进行属性填写时，需要利用人工的方式对货品的各项基本属性进行填写。但这样的方式仅适用于货品数量较少时；当货品达到一定的数量级，则人工填写货品属性的时间成本及人工成本就会变得巨大，并且工作效率较低。虽然现有的方案中存在一些填充算法可以实现对货品属性的自动填充，但仍存在一定的缺陷。例如，现有的填充算法需要根据货品的不同属性分别设计不同的填充规则，不具有普适性，并且填充率并不能得到有效的保证。举例来说，对于“屏幕尺寸”属性，需要提前设定对应的值域，如{4寸、4.5寸、4.8寸、5.2寸……}。当出现新的屏幕尺寸“5.9寸”，若未提前在值域内设置该“5.9寸”，则无法填充该屏幕尺寸值。对于颜色属性，如产品信息为“红辣椒华彩手机，黑色，5寸”，则对于“颜色”属性，由于产品信息中存在多个与“颜色”属性相关的关键词，使得填充算法并不一定能准确获取“黑色”的属性值，可能出现误配的情况。同时，对于经过填充算法自动填充后仍未能填写的货品属性，依然需要人工方式进行填写，使得填充率降低，从而降低了填写效率。需要...

【技术保护点】
1.一种货品属性填充方法，其特征在于，包括：从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据；获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵；利用机器学习算法对所述基础数据进行训练并生成分类器模型；利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值，并根据所述属性值对所述待填写货品进行属性值自动填写。

【技术特征摘要】
1.一种货品属性填充方法，其特征在于，包括：从待填写货品中获取典型货品并获取所述典型货品的属性值作为基础数据；获取所述待填写货品的描述信息并根据所述待填写货品的描述信息生成特征矩阵；利用机器学习算法对所述基础数据进行训练并生成分类器模型；利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值，并根据所述属性值对所述待填写货品进行属性值自动填写。2.根据权利要求1所述的货品属性填充方法，其特征在于，所述从待填写货品中获取典型货品包括：获取待填写货品并根据所述待填写货品的描述信息提取特征字段；依据提取的所述特征字段对所述待填写货品进行聚类；在聚类结果的每一类中随机抽取一个或多个所述待填写货品作为典型货品。3.根据权利要求2所述的货品属性填充方法，其特征在于，所述根据所述待填写货品的描述信息提取特征字段包括：对所述待填写货品的描述信息进行分词处理；根据所述分词处理后得到的分词利用word2vec模型提取各所述待填写货品的特征字段。4.根据权利要求2所述的货品属性填充方法，其特征在于，在根据所述待填写货品的描述信息生成特征矩阵时，所述方法还包括：判断是否接收到一填写数量m；在判断接收到所述填写数量m时，将所述待填写货品聚类的类别数量设置为m；其中，m>0。5.根据权利要求1所述的货品属性填充方法，其特征在于，所述根据所述待填写货品的描述信息生成特征矩阵包括：对所述待填写货品的描述信息进行分词处理以获取分词；利用预设模型对获取的所述分词进行特征字段提取；对提取的所述特征字段分别进行向量化处理、稀疏化处理以生成特征矩阵。6.根据权利要求1所述的货品属性填充方法，其特征在于，所述利用机器学习算法对所述基础数据进行训练并生成分类器模型包括：利用n种机器学习算法分别对所述基础数据进行训练并获取对应的n个分类器模型；其中，n>0；通过交叉验证评估各所述分类器模型对所述待填写货品属性的属性值填写的准确率；根据各所述分类器模型对于所述属性值填写的准确率计算各所述分类器模型对所述待填写货品的属性填写的权重；其中，其中，wc为分类器模型c的权重；n为分类器模型的数量；accuracycv为经交叉验证获取的准确率。7.根据权利要求6所述的货品属性填充方法，其特征在于，所述利用所述分类器模型及所述特征矩阵获取所述待填写货品的属性值包括：根据各所述分类器模型对所述待填写货品各属性填写的权重选择分类器模型的输出结果作为所述待填写货品的属性值。8.根据权利要求6所述的货品属性填充方法，其特征在于，所述方法还包括：利用一自动字典模型根据所述基础数据及各所述待填写货品的描述信息计算所述基础数据中各属性值与各所述待填写货品之间的关系分数；根据所述自动字典模型计算的所述关系分数及所述n个分类器模型的权重计算所述待填写货品当前属性对应属性值的信心得分S：其中，C为分类器模型的集合；fc(i)∈{0，1}，表示该分类器模型c对当前待填写货品是否填写属性值；wc∈...

【专利技术属性】
技术研发人员：刘寅亮，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人