System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于用户习惯的数据分类方法、系统、装置及存储介质制造方法及图纸_技高网

基于用户习惯的数据分类方法、系统、装置及存储介质制造方法及图纸

技术编号:41224052 阅读:2 留言:0更新日期:2024-05-09 23:42
本发明专利技术公开了一种基于用户习惯的数据分类方法、系统、装置及存储介质,该方案通过实时获取用户习惯数据,对获取的用户习惯数据进行预处理,得到标准数据集;然后,将得到的标准数据集输入特征提取模型中进行特征提取,得到目标特征向量集,该目标特征向量集包括有用户习惯数据的颜色特征向量、类型特征向量、纹理和形状特征向量以及风格特征向量,然后将特征提取得到的目标特征向量集输入训练好的分类模型中进行预测分类,输出分类结果;可提高分类的准确性,满足用户的个性化需求。本发明专利技术实施例可广泛应用于数据处理技术领域。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于用户习惯的数据分类方法、系统、装置及存储介质


技术介绍

1、现有的服装生产技术十分成熟,因此在服装生产中存在着产能过剩问题,例如,当市场上出现某一种热门服装类型时,许多厂家针对该热门服装类型进行生产,当该类型需求饱和或者市场发生变化后,厂家并没有调整生产,导致产能过剩和库存积压,造成浪费;现有技术中可以通过对市场中的服装数据进行预测分类,得到分类结果,进而指导厂家生产;但现有技术中,采用的分类算法准确性低,对服装数据中的特征处理效果差,难以满足用户的个性化需求。


技术实现思路

1、有鉴于此,本专利技术实施例的目的是提供一种基于用户习惯的数据分类方法、系统、装置及存储介质,能够提高分类准确性,满足个性化需求。

2、为实现上述目的,本申请实施例的一方面提出了一种基于用户习惯的数据分类方法,所述方法包括:

3、实时获取用户习惯数据,并对所述用户习惯数据进行预处理,得到标准数据集;其中,所述标准数据集包括图像数据和文本数据;

4、将所述标准数据集输入特征提取模型进行特征提取,得到目标特征向量集;其中,所述目标特征向量集包括颜色特征向量、类型特征向量、纹理和形状特征向量以及风格特征向量;

5、将所述特征向量集输入训练好的分类模型进行预测分类,确定分类结果。

6、在一些实施例中,所述对所述用户习惯数据进行预处理,得到标准数据集,具体包括:

7、根据预设算法对所述用户习惯数据进行数据清洗,并根据对数据清洗后的所述用户习惯数据进行规范化处理,得到标准数据集。

8、在一些实施例中,所述将所述标准数据集输入特征提取模型进行特征提取,得到目标特征向量集,具体包括:

9、根据所述标准数据集分别确定图像数据和文本数据,根据所述特征提取模型分别确定第一子模型和第二子模型;

10、将所述图像数据输入所述第一子模型进行处理,得到图像特征向量集,将所述文本数据输入第二子模型进行处理,得到风格特征向量;其中,所述图像特征向量集包括颜色特征向量、类型特征向量以及纹理和形状特征向量;

11、将所述图像特征向量集与所述风格特征向量进行拼接,得到目标特征向量集。

12、在一些实施例中,所述将所述图像数据输入所述第一子模型进行处理,得到图像特征向量集,具体包括:

13、对所述图像数据进行颜色空间转换,得到第一数据,对所述第一数据进行聚类,确定聚类中心,并根据所述聚类中心与预设表确定目标颜色信息,作为颜色特征向量;

14、根据第一预设算法对所述图像数据进行特征提取,得到第一特征信息,将所述第一特征信息输入第一分类器,得到第一分类结果,并根据所述第一分类结果确定所述第一分类结果对应的标签,根据所述第一特征信息与所述标签确定类型特征向量;其中,所述第一特征信息表征所述图像数据的类型特征;

15、根据第二预设算法对所述图像数据进行特征提取,得到第二特征信息,将所述第二特征信息,将所述第二特征信息转换称一维向量,作为纹理和形状特征向量;其中,所述第二特征信息表征所述图像数据的纹理和形状特征;

16、根据所述颜色特征向量、所述类型特征向量以及所述纹理和形状特征向量确定图像特征向量集。

17、在一些实施例中,所述将所述文本数据输入第二子模型进行处理,得到风格特征向量,具体包括:

18、根据所述文本数据确定若干组词向量,并计算每组所述词向量的均值,得到若干组第一向量;其中,所述第一向量表征所述文本数据中句子的向量;

19、根据预设算法计算若干组所述第一向量对应的相似值,并对所述相似值进行排序;

20、根据排序结果确定风格特征向量。

21、在一些实施例中,所述预测分类模型通过以下方法训练得到:

22、获取样本数据,并对所述样本数据进行特征提取,得到样本特征向量集;

23、根据所述样本特征向量集分别构建样本特征矩阵和样本标签向量;

24、构建第一分类模型,将所述样本特征矩阵输入所述第一分类模型进行训练,得到训练结果;其中,所述第一分类模型包括若干个基础模型;

25、根据所述训练结果与所述样本标签向量计算准确率,并将所述准确率与预设阈值进行比较,若所述准确率大于或等于所述预设阈值,将训练后的所述第一分类模型作为分类模型,若所述准确率小于所述预设阈值,返回将所述样本特征矩阵输入所述第一分类模型进行训练这一步骤,直至所述准确率大于或等于所述预设阈值。

26、在一些实施例中,所述将所述样本特征矩阵输入所述第一分类模型进行训练,得到训练结果,具体包括:

27、根据所述第一分类模型确定若干个基础模型,并获取若干个所述基础模型对应的权重;

28、将所述样本特征矩阵分别输入若干个所述基础模型进行预测分类,得到若干个基础分类结果;

29、根据所述权重与若干个所述基础分类结果进行加权投票,得到训练结果。

30、为实现上述目的,本申请实施例的另一方面提出了一种基于用户习惯的数据分类系统,所述系统包括:

31、第一模块,用于实时获取用户习惯数据,并对所述用户习惯数据进行预处理,得到标准数据集;其中,所述标准数据集包括图像数据和文本数据;

32、第二模块,用于将所述标准数据集输入特征提取模型进行特征提取,得到目标特征向量集;其中,所述目标特征向量集包括颜色特征向量、类型特征向量、纹理和形状特征向量以及风格特征向量;

33、第三模块,用于将所述特征向量集输入训练好的投票分类模型进行预测分类,得到若干个子分类结果,并对若干个所述子分类结果进行加权聚合,得到目标分类结果。

34、为实现上述目的,本申请实施例的另一方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前面所述的方法。

35、为实现上述目的,本申请实施例的另一方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前面所述的方法。

36、实施本专利技术实施例包括以下有益效果:本申请提供一种基于用户习惯的数据分类方法、系统、装置及存储介质,该方案通过实时获取用户习惯数据,对获取的用户习惯数据进行预处理,得到标准数据集;然后,将得到的标准数据集输入特征提取模型中进行特征提取,得到目标特征向量集,该目标特征向量集包括有用户习惯数据的颜色特征向量、类型特征向量、纹理和形状特征向量以及风格特征向量,然后将特征提取得到的目标特征向量集输入训练好的分类模型中进行预测分类,输出分类结果。通过对获取的用户习惯数据进行特征提取得到的特征向量集进行分类,得到若干个子分类结果,在对若干个子分类结果进行加权聚合,提高分类的准确性,并根据分类结果进行生产,满足用户的个性化需求。

本文档来自技高网...

【技术保护点】

1.一种基于用户习惯的数据分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述用户习惯数据进行预处理,得到标准数据集,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述标准数据集输入特征提取模型进行特征提取,得到目标特征向量集,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述图像数据输入所述第一子模型进行处理,得到图像特征向量集,具体包括:

5.根据权利要求3所述的方法,其特征在于,所述将所述文本数据输入第二子模型进行处理,得到风格特征向量,具体包括:

6.根据权利要求1所述的方法,其特征在于,所述预测分类模型通过以下方法训练得到:获取样本数据,并对所述样本数据进行特征提取,得到样本特征向量集;

7.根据权利要求6所述的方法,其特征在于,所述将所述样本特征矩阵输入所述第一分类模型进行训练,得到训练结果,具体包括:

8.一种基于用户习惯的数据分类系统,其特征在于,包括:

9.一种基于用户习惯的数据分类装置,其特征在于,包括:

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。

...

【技术特征摘要】

1.一种基于用户习惯的数据分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述用户习惯数据进行预处理,得到标准数据集,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述标准数据集输入特征提取模型进行特征提取,得到目标特征向量集,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述图像数据输入所述第一子模型进行处理,得到图像特征向量集,具体包括:

5.根据权利要求3所述的方法,其特征在于,所述将所述文本数据输入第二子模型进行处理,得到风格特征向量,具体包括:

...

【专利技术属性】
技术研发人员:邓启志李廷威许东武
申请(专利权)人:广东万丈金数信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1