物料数据长描述对应小类名称分类方法技术

技术编号：22944827 阅读：21 留言：0更新日期：2019-12-27 17:13

本发明专利技术公开了一种物料数据长描述对应小类名称分类方法。本发明专利技术物料数据的小类类别的分类，首先能准确分析数据中存在的问题，如大小写/全半角、连接符、单位不统一，读音相似问题，进行合理的数据预处理过程，将数据规范化、标准化，然后转化成特征向量的形式，采用logistic回归+L2正则化+L‑BFGS优化的方法对其进行分类，本发明专利技术可以实现对物料快速、准确的分类，提高了企业在物料存取的工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
物料数据长描述对应小类名称分类方法
本专利技术涉及物料数据分类
，尤其涉及物料数据长描述对应小类名称分类方法。
技术介绍
物料主数据包含了对所有企业所采购、生产和存储在库存中物料的描述。它是企业中有关物料信息(例如，库存水平)的物料数据代码库。将所有的物料数据集成在单一的物料数据库中，消除了数据冗余的问题，而且不仅允许采购部门使用这些数据，而且其它应用部门(例如，库存管理、物料计划及控制、发票校验等)也可以使用这些数据。物料分类是指按照一定的排列次序和组合方式，对具有相同自然属性的物料进行分类。物料分类过程中应尽量遵循以自然属性分类的基本准则，现有的物料分类效率低下，而且容易出现分类错误的现象。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的一个目的在于提出物料数据长描述对应小类名称分类方法，本专利技术可以实现对物料快速、准确的分类，提高了企业在物料存取的工作效率。根据本专利技术实施例的一种物料数据长描述对应小类名称分类方法，方法步骤如下：S1：原始物料数据：对原始物料的数据进行读入；S2：数据预处理：对读入的原始物料数据进行预处理，将数据规范化、标准化；S3：类别转数字：将原始物料数据类别列编码成数字；S4：样本集划分：将样本集划分为训练集和测试集；S5：特征向量化：将物料长描述转换为特征向量形式；S6：分类：通过学习得到一个目标函数，把每个特征集映射到一个预先定义的类标号；S7：...

【技术保护点】
1.一种物料数据长描述对应小类名称分类方法，方法步骤如下：/nS1：原始物料数据：对原始物料的数据进行读入；/nS2：数据预处理：对读入的原始物料数据进行预处理，将数据规范化、标准化；/nS3：类别转数字：将原始物料数据类别列编码成数字；/nS4：样本集划分：将样本集划分为训练集和测试集；/nS5：特征向量化：将物料长描述转换为特征向量形式；/nS6：分类：通过学习得到一个目标函数，把每个特征集映射到一个预先定义的类标号；/nS7：分类结果评估：通过分类结果度量来评估分类结果。/n

【技术特征摘要】
1.一种物料数据长描述对应小类名称分类方法，方法步骤如下：
S1：原始物料数据：对原始物料的数据进行读入；
S2：数据预处理：对读入的原始物料数据进行预处理，将数据规范化、标准化；
S3：类别转数字：将原始物料数据类别列编码成数字；
S4：样本集划分：将样本集划分为训练集和测试集；
S5：特征向量化：将物料长描述转换为特征向量形式；
S6：分类：通过学习得到一个目标函数，把每个特征集映射到一个预先定义的类标号；
S7：分类结果评估：通过分类结果度量来评估分类结果。

2.根据权利要求1所述的物料数据长描述对应小类名称分类方法，所述S2包括如下步骤：
S21：对原始物料数据单位和连接符统一化；
S22：去掉括号和斜杠；
S23：中文分词后进行文字转拼音；
S24：大写转小写和全角转半角。
...

【专利技术属性】
技术研发人员：隋怡，杨浩东，张复生，
申请(专利权)人：陕西优百信息技术有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人