一种基于端到端的大型知识图谱构建和存储方法和系统技术方案

技术编号:38677957 阅读:16 留言:0更新日期:2023-09-02 22:52
本发明专利技术提供一种基于端到端的大型知识图谱构建和存储方法和系统,包括服装图谱构建模块、服装标签抽取模块、服装品质画像模块和服装品质反馈模块组成的构建架构,所述服装图谱构建模块包含:服装品类命名识别模块和同族服装关系抽取模块;从模型库中导入预训练的端到端神经网络模型,并且提取相关文本输入模型,通过所述服装品类命名识别模块创建大量的服装模型,所述服装模型包括实体指导模型和图片指导模型,根据所述服装模型获取大量服装的实体指导模型和图片指导模型,根据所述服装模型获取大量服装的实体指导模型和图片指导模型。本发明专利技术可以根据用户的需求,以及用户画像的应用方向进行不同策略的服装标签选择。用方向进行不同策略的服装标签选择。用方向进行不同策略的服装标签选择。

【技术实现步骤摘要】
一种基于端到端的大型知识图谱构建和存储方法和系统


[0001]本专利技术涉及服装设计
,尤其涉及一种基于端到端的大型知识图谱构建和存储方法和系统。

技术介绍

[0002]服装定制企业的业务处理是生产经营活动中进行的,例如:布料进料的财务审批、量体师培训、量体师资格审批、服装订单派单、车间工艺流程调配等一系列需要进行的业务的处理。随着网络的普及和科技的发展,人们越来越多喜爱通过网络采购各种物品,人们吃、穿、住、行都可以通过从网络平台购买或预订。尤其是穿,各种网络平台层出不穷,每个网络平台都有大量的店铺出售各种各样的服装,供人们根据自己的喜爱和需求购买各种类型、各种品牌的衣物。
[0003]为了更好的满足人们的需求,各个平台还设置有各自的推荐机制,例如,某用户在某平台的某店铺采购了服装,则该平台会将与该服装款式类似的其他服装推荐给该用户。但该推荐方式的粒度过大,导致向用户推荐的服装不能满足用户需求,未能实现服装品牌的精准化定位推荐。

技术实现思路

[0004]针对上述问题,本专利技术提供一种基于端到端的大型知识图谱构建和存储方法和系统,本专利技术可以根据用户的需求,以及用户画像的应用方向进行不同策略的服装标签选择。
[0005]为解决上述问题,本专利技术所采用的技术方案是:一种基于端到端的大型知识图谱构建和存储方法和系统,包括服装图谱构建模块、服装标签抽取模块、服装品质画像模块和服装品质反馈模块组成的构建架构;所述服装图谱构建模块包含:服装品类命名识别模块和同族服装关系抽取模块;从模型库中导入预训练的端到端神经网络模型,并且提取相关文本输入模型;通过所述服装品类命名识别模块创建大量的服装模型;所述服装模型包括实体指导模型和图片指导模型;根据所述服装模型获取大量服装的实体指导模型和图片指导模型,根据所述实体指导模型数据和图片指导模型数据构建大量服装的服装图谱模型;根据所述服装图谱构建模块提取出用于构建服装图谱的节点间的关系;基于所述节点间的关系,利用预设的服装图形数据库构建出所述大量服装的标签图谱;服装图形数据库中节点与节点间的误差的具体过程如下:均方根误差(RMSE)指的是:预测值与实际值偏差的平方与观测次数的比值的算术平方根,公式表示如下:;
当预测值接近实际值时,RMSE值会达到最小值为0,当预测值远离实际值时,RMSE值达到无穷大;平均绝对误差(MAE),是所有单个节点值与算术平均值的偏差的绝对值的平均,MAE定义如下式所示,该指标是对预测误差平均幅值的评价,;式中,为预测节点个数,为服装图形数据库中的节点数据,当预测值和实际值几乎相等时,MAE值趋于0,随着误差的增大,MAE值趋于无穷大,即随着预测值的实际值之间的误差增大,MAE值会呈线性增长;服装品质画像模块通过服装品质反馈模块得到的服装图谱数据加入原有数据库中的服装图谱数据同时进行训练,进而提高服装模型的识别准确率;从服装图形数据库中导入预训练的端对端神经网络进行实体关系的直接预测,由此得到的实体指导模型的外部服装图谱补充到端对端神经网络的训练中;服装标签抽取模块包含服装标签选择、图谱数据清洗和服装标签存储;服装标签选择:根据用户的需求,以及用户画像的应用方向进行不同策略的服装标签选择;图谱数据清洗:标签是服装图形数据库中某个字段所对应的内容,也可能是内容中的内容,此时就需要对字段对应的内容进行清洗;服装标签存储:将得到的标签按用户名称存储到服装图形数据库中,每个用户会对应多个标签;若标签错误,则根据标签的产生方向分别反馈至样本库或数据库中,作为对数据和算法的修正。
[0006]优选地,根据所述实体指导模型和对大量服装进行系统划分,并根据划分的结果对实体指导模型进行调整。
[0007]优选地,根据所述实体指导模型对大量服装进行物理结构分解,并根据所述物理结构分解的结果对实体指导模型进行调整,基于调整后的实体指导模型,根据服装图谱信息数据构建得到大量服装的实体模型。
[0008]优选地,所述图片指导模型用于对获取到的大量的服装模型进行分析,提取出大量的服装模型的特征信息,并根据所述特征信息创建所述面向服装模型的服装图谱模型。
[0009]优选地,所述服装标签在完成选择后,再通过服装图形数据库确定需要选取的字段,从字段中抽取所需要的标签。
[0010]优选地,分别获取各实体指导模型中的首尾实体,并在各实体指导模型之间进行首尾实体的匹配,若不同实体指导模型之间的首尾实体匹配成功时,则分别获取不同实体指导模型的关系标识。
[0011]优选地,所述服装品质画像模块内部存储有服装数据信息,所述服装数据信息包括结构化数据、半结构化数据以及非结构化数据。
[0012]优选地,基于服装图谱模型构建多个服装板块分析模型,并通过对应的服装样本数据对各个服装板块分析模型进行训练,以得到优化后的服装板块分析模型。
[0013]优选地,统计服装图谱模型关联的所有标准图谱信息,并输入对应的优化后的服
装板块分析模型中,输出对应的分析结果。
[0014]一种基于端到端的大型知识图谱构建和存储系统的方法,包括以下步骤;S1、先构建服装图谱构建模块和服装标签抽取模块,服装图谱构建模块包含服装品类命名识别模块和同族服装关系抽取模块,服装标签抽取模块包含服装标签选择、图谱数据清洗和服装标签存储;S2、构建服装品质画像模块和服装品质反馈模块,服装品质画像模块通过服装品质反馈模块得到的服装图谱数据加入原有数据库中的服装图谱数据同时进行训练;S3、对实体指导模型和对大量服装进行系统划分,并根据划分的结果对实体指导模型进行调整;S4、基于调整后的实体指导模型,根据服装图谱信息数据构建得到大量服装的实体模型。
[0015]本专利技术的有益效果为:1.可以依据服装的模型数据,构建服装知识图谱,再查找与服装知识图谱中各历史品牌数据分别对应的服装品牌数据,并将各历史品牌数据及其对应的服装品牌数据形成为品牌数据矩阵,可以根据用户的需求,以及用户画像的应用方向进行不同策略的服装标签选择。
[0016]2.基于服装知识图谱中各历史服装数据对应的模型数据,生成与该服装数据对应的服装标签,以便于从各服装品牌数据中筛选出目标品牌数据进行推荐。
附图说明
[0017]图1为本专利技术的系统框图;图2为本专利技术的流程框图。
具体实施方式
[0018]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]参照图1

图2;一种基于端到端的大型知识图谱构建和存储方法和系统,包括服装图谱构建模块、服装标签抽取模块、服装品质画像模块和服装品质反馈模块组成的构建架构,所述服装图谱构建模块包含:服装品类命名识别模块和同族服装关系抽取模块;从模型库中导入预训练的端到端神经网络模型,并且提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于端到端的大型知识图谱构建和存储系统,其特征在于,包括服装图谱构建模块、服装标签抽取模块、服装品质画像模块和服装品质反馈模块组成的构建架构;所述服装图谱构建模块包含:服装品类命名识别模块和同族服装关系抽取模块;从模型库中导入预训练的端到端神经网络模型,并且提取相关文本输入模型;通过所述服装品类命名识别模块创建大量的服装模型;所述服装模型包括实体指导模型和图片指导模型;根据所述服装模型获取大量服装的实体指导模型和图片指导模型,根据所述实体指导模型数据和图片指导模型数据构建大量服装的服装图谱模型;根据所述服装图谱构建模块提取出用于构建服装图谱的节点间的关系;基于所述节点间的关系,利用预设的服装图形数据库构建出所述大量服装的标签图谱;服装图形数据库中节点与节点间的误差的具体过程如下:均方根误差RMSE指的是:预测值与实际值偏差的平方与观测次数的比值的算术平方根,公式表示如下:;当预测值接近实际值时,RMSE值会达到最小值为0,当预测值远离实际值时,RMSE值达到无穷大;平均绝对误差MAE,是所有单个节点值与算术平均值的偏差的绝对值的平均,MAE定义如下式所示,是对预测误差平均幅值的评价,;式中,为预测节点个数,为服装图形数据库中的节点数据,当预测值和实际值几乎相等时,MAE值趋于0,随着误差的增大,MAE值趋于无穷大,即随着预测值的实际值之间的误差增大,MAE值会呈线性增长;服装品质画像模块通过服装品质反馈模块得到的服装图谱数据加入原有数据库中的服装图谱数据同时进行训练,进而提高服装模型的识别准确率;从服装图形数据库中导入预训练的端对端神经网络进行实体关系的直接预测,由此得到的实体指导模型的外部服装图谱补充到端对端神经网络的训练中;服装标签抽取模块包含服装标签选择、图谱数据清洗和服装标签存储;服装标签选择:根据用户的需求,以及用户画像的应用方向进行不同策略的服装标签选择;图谱数据清洗:标签是服装图形数据库中某个字段所对应的内容,也可能是内容中的内容,此时就需要对字段对应的内容进行清洗;服装标签存储:将得到的标签按用户名称存储到服装图形数据库中,每个用户会对应多个标签;若标签错误,则根据标签的产生方向分别反馈至样本库或数据库中,作为对数据和算法的修正。
2.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储系统,其特征在于,根据所述实体指导模型和对大量服装进行系统划分,并根据划分的结果对实体指导模型进行调整。3.根据权利要求...

【专利技术属性】
技术研发人员:孙兆洋隋媛张莺李文武王志强
申请(专利权)人:中国标准化研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1