一种提取识别线上或系统商品特征信息的系统技术方案

技术编号:30543175 阅读:34 留言:0更新日期:2021-10-30 13:21
本发明专利技术公开一种提取识别线上或系统商品特征信息的系统,所述商品特征信息识别是将描述特定商品的属性字段进行提取,涉及商品信息特征识别领域。所述的特征提取模块包括:标题模块301、文字描述模块302、图片描述模块303、符号分隔模块304,标题模块301获取商品标题文字,将标题进行分词,计算词组权重,输出品牌名称和商品特征属性;本发明专利技术通过设置深度神经网络模型,可以根据类别预测描述商品特征信息,增强商品本身特征信息计算的权重,提高准确率。率。率。

【技术实现步骤摘要】
一种提取识别线上或系统商品特征信息的系统


[0001]本专利技术属于商品信息特征识别领域,特别涉及一种提取识别线上或系统商品特征信息的系统。

技术介绍

[0002]商品的特征信息能够区别商品在不同领域的差异性,商品特征属性是商品性质的集合,是商品差异性的集合。而电商平台上商品存在的商品特征信息是不规则的、没有经过同一的信息,当我们想利用商品的特征信息来确定商品的唯一性时,原始的数据是完全不可以使用的,因此不利于后续工作的开展。
[0003]而当我们将线上商品的特征信息进行提取并且进行加工整理之后,可以通过描述商品的特征信息字段,来确认上商品本身,则需要一种能够识别线上商品特征信息的系统,完成这一工作。

技术实现思路

[0004]针对上述技术问题本专利技术提供一种提取识别线上或系统商品特征信息的系统,能够对描述线上商品的特征信息进行提取,工作效率高。
[0005]为解决上述技术问题,本专利技术采用的技术方案为:一种提取识别线上或系统商品特征信息的系统,其特征在于:所述商品特征信息识别是将描述特定商品的属性字段进行提本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种提取识别线上或系统商品特征信息的系统,其特征在于:所述商品特征信息识别是将描述特定商品的属性字段进行提取,其具体的步骤为:步骤S10:收集电商平台商品特征信息,通过人工数据校对、标注,使数据为字典形式,字典格式为:{类别,特征属性},将商品特征信息放入循环神经网络模型中进行训练,计算类别与特征属性的相关度,并保存网络模型参数;步骤S20:输入商品地址或推送商品信息系统,特征提取模块获取商品详情状态,判断文字描述信息和图片描述信息的存在状态,选择不同的工作模式:1)只存在文字描述信息;2)文字描述信息和图片描述信息同时存在;步骤S30:基于步骤S20的工作模式,利用特征提取模块,对商品的特征信息进行识别并提取,将提取的特征信息保存到原始信息库中;步骤S40:将原始信息库中的特征信息进行数据处理,通过分词、清洗、预测、整理等步骤,使原始信息库中的特征信息转化为标准信息库中的特征信息,对商品的特征信息进行格式化处理;步骤S50:将提取到的特征信息进行格式化组合:首先计算提取到的每一项特征信息与已知商品的特征信息计算相关度,得出该特征信息可以描述商品的置信度,然后将高置信度的特征信息进行有序组合,使特征信息能够完整的描述商品,此特征信息包含描述商品的所有字段。2.根据权利要求1所述的一种提取识别线上或系统商品特征信息的系统,其特征在于:步骤S10中训练循环神经网络模型的具体步骤为:步骤S101:首先爬取商品销售平台的公开数据,提取商品类别及商品的各种描述特征,并以表格形式存储;步骤S102:通过人工对数据校对、标注,使数据形成{类别,特征属性}的形式,建立词表,类别为商品在电商平台的上位分类,特征属性为多个描述商品的属性;步骤S103:将人工标注过的数据输入到长短期记忆网络模型中,建立特征与形与类别的损失函数,优化损失函数,通过输入商品的特征信息,学习并预测商品的类别,构成编码器;网络模型通过反向传播更新参数;步骤S104:训练长短期记忆网络模型...

【专利技术属性】
技术研发人员:蔡毅辉陈明君贾艺璇
申请(专利权)人:上海普洛斯普新数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1