一种自适应商品模板识别及商品图谱结构化方法技术

技术编号:38083870 阅读:9 留言:0更新日期:2023-07-06 08:50
本发明专利技术公开了一种自适应商品模板识别及商品图谱结构化方法,包括步骤S1获取用户填入的原始信息;步骤S2将原始信息输入关键词提取模型中得到若干商品关键词;步骤S3根据各商品关键词构建商品图谱;步骤S4根据预先存储的若干标准关键词和相应标准实体训练得到一实体识别模型,将商品图谱中属于同一商品的各商品关键词输入实体识别模型中,得到识别商品实体;步骤S5计算识别商品实体与商品图谱中的商品实体之间的第一相似度,在第一相似度大于第一预设阈值时,将商品图谱中的商品实体作为确认商品实体;步骤S6根据各确认商品实体在匹配数据库中匹配得到相应的商品模板。本发明专利技术实现了自动识别商品模板。了自动识别商品模板。了自动识别商品模板。

【技术实现步骤摘要】
一种自适应商品模板识别及商品图谱结构化方法


[0001]本专利技术涉及电子商务
,尤其涉及一种自适应商品模板识别及商品图谱结构化方法。

技术介绍

[0002]知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。用于电子商务的知识图谱被称为商品图谱。商品图谱一般应用于电商网站的商品推荐系统中。商品模板应用于电商网站,是商家配置商品相关信息时所选用的模板,用于提升商品信息录入的工作效率和便捷性,减少工作难度。但是,商家需要根据商品类型人工选择相应的商品模板进行细化配置,对于不熟悉如何选用商品模板的商家而言,需要外部指导才能争取选择商品模板,十分不便且效率低下,影响商家对商品模板的配置效率。

技术实现思路

[0003]针对现有技术存在的不足,本专利技术的目的在于提供一种自适应商品模板识别及商品图谱结构化方法,用于实现自动识别商品模板,提升商品模板配置效率。
[0004]为实现上述目的,本专利技术提供了如下技术方案:一种自适应商品模板识别及商品图谱结构化方法,包括:
[0005]步骤S1,获取用户填入的原始信息;
[0006]步骤S2,将所述原始信息输入预先训练完成的关键词提取模型中,得到若干商品关键词,所述商品关键词包括商品名称、商品品牌和商品型号;
[0007]步骤S3,根据各所述商品关键词构建商品图谱,所述商品图谱中包含有各商品关键词对应的商品实体,以及各所述商品实体之间的实体关系;
[0008]步骤S4,根据预先存储的若干标准关键词和相应标准实体训练得到一实体识别模型,将所述商品图谱中属于同一商品的各所述商品关键词输入所述实体识别模型中,得到识别商品实体;
[0009]步骤S5,计算所述识别商品实体与所述商品图谱中的所述商品实体之间的第一相似度,在所述第一相似度大于第一预设阈值时,将所述商品图谱中的所述商品实体作为确认商品实体;
[0010]步骤S6,匹配数据库中预先存储有各所述确认商品实体与相应商品模板之间的关联关系,根据各所述确认商品实体在所述匹配数据库中匹配得到相应的商品模板。
[0011]进一步地,所述步骤S4包括:
[0012]步骤S41,将若干所述标准关键词和相应所述标准实体划分为训练集和验证集;
[0013]步骤S42,根据训练集中的各所述标准关键词和相应所述标准实体训练得到所述实体识别模型;
[0014]步骤S43,将验证集中的各所述标准关键词输入所述实体识别模型中,得到预测商品实体,分别识别得到所述预测商品实体包含的若干预测商品属性以及相应所述标准实体包含的若干标准商品属性,将各所述预测商品属性和各所述标准商品属性代入预设的第二相似度计算公式中,得到第二相似度;
[0015]步骤S44,判断所述第二相似度是否大于所述第二预设阈值:
[0016]若是,则输出所述实体识别模型;
[0017]若否,则根据所述第二相似度与所述第二预设阈值之间的差值调整所述实体识别模型的模型参数并重新训练所述实体识别模型,直至所述第二相似度大于所述第二预设阈值。
[0018]进一步地,所述预测商品属性包括预测商品形状数据、预测商品颜色数据、预测商品尺寸数据、预测商品价格数据和预测商品配置数据,所述标准商品属性包括标准商品形状数据、标准商品颜色数据、标准商品尺寸数据、标准商品价格数据和标准商品配置数据;
[0019]所述第二相似度计算公式配置为:
[0020][0021]其中,S
im2
用于表示所述第二相似度;
[0022]S
h1
用于表示所述预测商品形状数据,S
h2
用于表示所述标准商品形状数据;
[0023]C
O1
用于表示所述预测商品颜色数据,C
O2
用于表示所述标准商品颜色数据;
[0024]S
i1
用于表示所述预测商品尺寸数据,S
i2
用于表示所述标准商品尺寸数据;
[0025]P
r1
用于表示所述预测商品价格数据,P
r2
用于表示所述标准商品价格数据;
[0026]D
i1
用于表示所述预测商品配置数据,D
i2
用于表示所述标准商品配置数据;
[0027]k1、k2、k3、k4、k5分别用于表示预设的第一系数、第二系数、第三系数、第四系数和第五系数,所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数均为常数。
[0028]进一步地,在根据所述第二相似度计算公式计算所述第二相似度的过程中,根据实时获取的所述标准实体的最新商品属性对所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数进行动态调整以更新所述第二相似度计算公式,动态调整后的所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数配置为:
[0029][0030]其中,k1'、k2'、k3'、k4'、k5'分别用于表示动态调整后的所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数;
[0031]S
k0
用于表示实时获取的最新商品形状数据,ΔS
k
用于表示所述标准商品形状数据与所述最新商品形状数据的平均值;
[0032]C
o0
用于表示实时获取的最新商品颜色数据,ΔC
o
用于表示所述标准商品颜色数据与所述最新商品颜色数据的平均值;
[0033]S
i0
用于表示实时获取的最新商品尺寸数据,ΔS
i
用于表示所述标准商品尺寸数据与所述最新商品尺寸数据的平均值;
[0034]P
r0
用于表示实时获取的最新商品价格数据,ΔP
r
用于表示所述标准商品价格数据与所述最新商品价格数据的平均值;
[0035]D
i0
用于表示实时获取的最新商品配置数据,ΔD
i
用于表示所述标准商品配置数据与所述最新商品配置数据的平均值。
[0036]进一步地,所述步骤S5包括:
[0037]步骤S51,分别识别得到所述识别商品实体包含的若干识别商品属性以及所述商品图谱中的所述商品实体包含的若干商品属性,将各所述识别商品属性和各所述标准商品属性代入预设的第一相似度计算公式中,得到第一相似度;
[0038]步骤S52,判断所述第一相似度是否大于所述第一预设阈值:
[0039]若是,则输出所述商品图谱;
[0040]若否,则根据所述第一相似度与所述第一预设阈值之间的差值重新构建所述商品图谱,直至所述第一相似度大于所述第一预设阈值。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应商品模板识别及商品图谱结构化方法,其特征在于:步骤S1,获取用户填入的原始信息;步骤S2,将所述原始信息输入预先训练完成的关键词提取模型中,得到若干商品关键词,所述商品关键词包括商品名称、商品品牌和商品型号;步骤S3,根据各所述商品关键词构建商品图谱,所述商品图谱中包含有各商品关键词对应的商品实体,以及各所述商品实体之间的实体关系;步骤S4,根据预先存储的若干标准关键词和相应标准实体训练得到一实体识别模型,将所述商品图谱中属于同一商品的各所述商品关键词输入所述实体识别模型中,得到识别商品实体;步骤S5,计算所述识别商品实体与所述商品图谱中的所述商品实体之间的第一相似度,在所述第一相似度大于第一预设阈值时,将所述商品图谱中的所述商品实体作为确认商品实体;步骤S6,匹配数据库中预先存储有各所述确认商品实体与相应商品模板之间的关联关系,根据各所述确认商品实体在所述匹配数据库中匹配得到相应的商品模板。2.根据权利要求1所述的自适应商品模板识别及商品图谱结构化方法,其特征在于,所述步骤S4包括:步骤S41,将若干所述标准关键词和相应所述标准实体划分为训练集和验证集;步骤S42,根据训练集中的各所述标准关键词和相应所述标准实体训练得到所述实体识别模型;步骤S43,将验证集中的各所述标准关键词输入所述实体识别模型中,得到预测商品实体,分别识别得到所述预测商品实体包含的若干预测商品属性以及相应所述标准实体包含的若干标准商品属性,将各所述预测商品属性和各所述标准商品属性代入预设的第二相似度计算公式中,得到第二相似度;步骤S44,判断所述第二相似度是否大于所述第二预设阈值:若是,则输出所述实体识别模型;若否,则根据所述第二相似度与所述第二预设阈值之间的差值调整所述实体识别模型的模型参数并重新训练所述实体识别模型,直至所述第二相似度大于所述第二预设阈值。3.根据权利要求2所述的自适应商品模板识别及商品图谱结构化方法,其特征在于:所述预测商品属性包括预测商品形状数据、预测商品颜色数据、预测商品尺寸数据、预测商品价格数据和预测商品配置数据,所述标准商品属性包括标准商品形状数据、标准商品颜色数据、标准商品尺寸数据、标准商品价格数据和标准商品配置数据;所述第二相似度计算公式配置为:其中,S
im2
用于表示所述第二相似度;S
h1
用于表示所述预测商品形状数据,S
h2
用于表示所述标准商品形状数据;C
O1
用于表示所述预测商品颜色数据,C
O2
用于表示所述标准商品颜色数据;S
i1
用于表示所述预测商品尺寸数据,S
i2
用于表示所述标准商品尺寸数据;
P
r1
用于表示所述预测商品价格数据,P
r2
用于表示所述标准商品价格数据;D
i1
用于表示所述预测商品配置数据,D
i2
用于表示所述标准商品配置数据;k1、k2、k3、k4、k5分别用于表示预设的第一系数、第二系数、第三系数、第四系数和第五系数,所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数均为常数。4.根据权利要求3所述的自适应商品模板识别及商品图谱结构化方法,其特征在于:在根据所述第二相似度计算公式计算所述第二相似度的过程中,根据实时获取的所述标准实体的最新商品属性对所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数进行动态调整以更新所述第二相似度计算公式,动态调整后的所述第一系数、所述第二系数、所述第三系数、所述第四系数和所述第五系数配置为:其中,k1'、k2'、k3'、k4'、k5'分别用于表示动态调整后的所述第一系数、所述第二系数...

【专利技术属性】
技术研发人员:周必奎
申请(专利权)人:杭州天识信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1