一种二手商品特征挖掘方法和系统技术方案

技术编号:37708444 阅读:15 留言:0更新日期:2023-06-01 23:59
本发明专利技术涉及一种二手商品特征挖掘方法和系统,其中所述方法包括:读取商品质检报告,从中获取文本信息;从文本信息中提取到一个或多个待定商品特征;将所述待定商品特征增加到功能模型的第一信息特征集合中构成第二信息特征集合;所述功能模型分别以所述第一信息特征集合和所述第二信息特征集合作为输入得到第一预测评估值和第二预测评估值;以及比较所述第一预测评估值和第二预测评估值;响应于第二预测评估值大于所述第一预测评估值,确认所述待定商品特征可用。本发明专利技术从商品质检报告中提取出可用、有效的商品特征,从而细化了对商品的描述,使得下游的储如搜索、推荐等服务能够更好地区分商品,提供更准确的召回商品。提供更准确的召回商品。提供更准确的召回商品。

【技术实现步骤摘要】
一种二手商品特征挖掘方法和系统


[0001]本专利技术涉及互联网应用领域,特别地涉及一种基于商品质检报告的二手商品特征挖掘方法和系统。

技术介绍

[0002]随着互联网应用及物流行业的发展,越来越多的商家与消费者倾向于在电子商业平台完成相应的交易。而其中的二手电商平台为人们提供了处置闲置物品的好去处。由于不同的使用情况,二手商品的状态千差万别。例如,即使是同一个品牌、同一个型号的手机,一个仅拆封而未使用,而另一个的外壳由于使用的原因已经有破损。如果仅采用如品牌、型号等一般商品常用的特征来描述,显然不能区分这两个商品。因而,为了能够更加准确地向用户推荐商品,需要对二手商品进行更加详细的特征挖掘。

技术实现思路

[0003]针对现有技术中存在的技术问题,本专利技术提出了一种二手商品特征挖掘方法和系统,用以从质检报告中获取有价值的商品特征,以丰富对二手商品的描述。
[0004]为了解决上述技术问题,根据本专利技术的一个方面,本专利技术提供了一种二手商品特征挖掘方法,其中包括以下步骤:读取商品质检报告,从中获取文本信息;从文本信息中提取到一个或多个待定商品特征;将所述待定商品特征增加到功能模型的第一信息特征集合中构成第二信息特征集合;所述功能模型分别以所述第一信息特征集合和所述第二信息特征集合作为输入得到第一预测评估值和第二预测评估值;以及比较所述第一预测评估值和第二预测评估值;响应于第二预测评估值大于所述第一预测评估值,确认所述待定商品特征可用。
[0005]根据本专利技术的另一个方面,本专利技术还提供了一种二手商品特征挖掘系统,其中包括文本获取模块、特征提取模块、输入特征确定模块、模型评估模块和确定模块,其中,所述文本获取模块经配置以读取商品质检报告,从中获取文本信息;所述特征提取模块与所述文本获取模块相连接,经配置以从所述文本信息中提取到一个或多个待定商品特征;所述输入特征确定模块与所述特征提取模块相连接,经配置以将所述待定商品特征增加到功能模型的第一信息特征集合中构成第二信息特征集合;所述模型评估模块与所述输入特征确定模块相连接,经配置以将所述第一信息特征集合和所述第二信息特征集合分别作为所述功能模型输入,以得到第一预测评估值和第二预测评估值;所述确定模块与所述模型评估模块相连接,经配置以比较所述第一预测评估值和第二预测评估值,在第二预测评估值大于所述第一预测评估值时确认所述待定商品特征可用。
[0006]本专利技术从商品质检报告中提取出可用、有效的商品特征,从而细化了对二手商品的描述,使得下游的储如搜索、推荐等服务能够更好地区分二手商品,提供更准确的召回商品。
附图说明
[0007]下面,将结合附图对本专利技术的优选实施方式进行进一步详细的说明,其中:
[0008]图1是根据本专利技术的一个实施例提供的二手商品特征挖掘方法流程图;
[0009]图2是根据本专利技术的一个实施例从质检项内容中提取待定商品特征的流程图;
[0010]图3是根据本专利技术的一个实施例从说明信息中提取待定商品特征的流程图;
[0011]图4是根据本专利技术的一个实施例中使用线上正在应用的模型获得两个预测评估值的过程流程图;
[0012]图5是根据本专利技术的一个实施例中训练模型并获得两个预测评估值的过程流程图;
[0013]图6是根据本专利技术一个实施例的一种二手商品特征挖掘系统原理框图;
[0014]图7是根据本专利技术一个实施例的文本获取模块原理框图;
[0015]图8是根据本专利技术一个实施例的特征提取模块原理框图;
[0016]图9是根据本专利技术另一实施例的二手商品特征挖掘系统原理框图;以及
[0017]图10是根据本专利技术又一实施例的二手商品特征挖掘系统原理框图。
具体实施方式
[0018]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。
[0020]在本专利技术中,为了获得二手商品的详细况状,提高用户对商品的信任度,有些二手电商平台为在其平台上销售的二手商品进行质检,并根据质检结果出具质检报告。质检项根据商品及其类别各不相同,例如,对于电脑,其质检项包括多个大项及大项中的小项,大项例如为CPU检测项、硬盘检测项、内存检测项、屏幕检测项、外观检测项等,小项例如CPU检测项中包括的“CPU系列”和“CPU型号”,硬盘检测项包括的“硬盘1”、“硬盘2”等等。其中,在一个实施例中,在出具质检报告时,系统中对于每个检测项提供有多个可选内容,例如,“CPU”系列可包括英特尔的“睿酷”、“奔腾”、“赛扬”等系列,AMD的“锐龙”、“速龙”、“闪龙”等系列,“CUP型号”例如包括“i9

10900K”、“i7

9700KF”、“R9

3900X”等等,在出具质检报告时,根据商品从质检项中选择对应的内容。当选项中没有对应的选项内容时,具有权限的相关人员可根据商品的实际情况在质检项的选项中增加内容。因而得到的质检报告中,每一个质检项对应一个质检内容。由于质检项并不能包括所有可能的商品况状,因而在质检报告中通常还包括说明信息,即用于说明质检项中没有的情况,例如一份手机质检报告的说明信息包括以下内容“经检测,设备后壳脱胶、存在封胶无法检测内部拆修浸液情况,前摄玻璃处碎裂,屏幕有磕痕,卡1存在间歇性不读卡现象”。分析上述质检报告中的各个部分的
内容可知,质检报告中包含的内容能够更加详细地描述商品,可以使当前检测商品在众多同类商品具有更高的辨识度。因而,本专利技术提供了一种商品特征挖掘方法和系统,基于为二手商品出具的质检报告,从中提取出可用且有效的商品特征,从而丰富二手商品特征。
[0021]图1是根据本专利技术一个实施例提供的二手商品特征挖掘方法流程图。在本实施例中,所述商品特征挖掘方法包括以下步骤:
[0022]步骤S1,读取商品质检报告,从中获取文本信息。在一个实施例中,与商品对应的商品质检报告存储在数据库中,商品质检报告具有独立标识,或者采用对应商品的商品标识进行标识。从数据库中读取到该商品的质检报告,读取其中的质检项及其具体内容和额外增加的说明信息。
[0023]步骤S2,从文本信息中提取到一个或多个待定商品特征。其中,由于文本信息包括质检项内容和额外增加的说明内容,因而分别从质检项内容和额外增加的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种二手商品特征挖掘方法,其中包括:读取商品质检报告,从中获取文本信息;从文本信息中提取到一个或多个待定商品特征;将所述待定商品特征增加到功能模型的第一信息特征集合中构成第二信息特征集合;所述功能模型分别以所述第一信息特征集合和所述第二信息特征集合作为输入得到第一预测评估值和第二预测评估值;比较所述第一预测评估值和第二预测评估值;以及响应于第二预测评估值大于所述第一预测评估值,确认所述待定商品特征可用。2.根据权利要求1所述的方法,其中,所述文本信息包括商品质检报告中的质检项目信息,所述待定商品特征为从所述质检项目信息中提取的特征。3.根据权利要求1所述的方法,其中,所述文本信息包括商品质检报告中的说明信息,所述待定商品特征为从所述说明信息中提取的特征。4.根据权利要求3所述的方法,其中,从所述说明信息中提取待定商品特征的步骤包括:对所述说明信息分词、统计词频,确定出词频大于阈值的第一词汇;提取所述第一词汇的上下文信息;从所述上下文信息中提取出一个或多个第二词汇;统计每个第二词汇与第一词汇的共现次数;以及在所述第二词汇与第一词汇的共现次数大于阈值时,确定所述第二词汇与所述第一词汇构成待定商品特征。5.根据权利要求4所述的方法,其中,在第一词汇分别与多个第二词汇构成多个待定商品特征时,以所述第一词汇作为待定商品特征,所述第二词汇作为特征值。6.根据权利要求1所述的方法,其中进一步包括:获取功能模型的第一样本集和第二样本集,所述第一/二样本集包括对应的训练集和测试集,所述第一样本集中的样本由第一信息特征集合构成,所述第二样本集中的样本由第二信息特征集合构成;根据第一/二样本集中的样本训练得到第一/二功能模型;以及将第一/二样本集中的测试集样本输入给所述第一/二功能模型,根据得到的预测值计算得到对应的第一/二预测评估值。7.根据权利要求1所述的方法,其中进一步包括:将所述可用待定商品特征加入到线上功能模型的输入特征集合中进行线上AB实验,其中,A版功能模型的特征集合中不包括所述可用待定商品特征;B版功能模型的特征集合中包括所述可用待定商品特征。获取线上A版功能模型的第一功能效果数据和线上B版功能模型的第二功能效果数据;对比所述第一功能效果数据和第二功能效果数据;以及响应于所述第二功能效果数据优于所述第一功能效果数据,确定所述可用待定商品特征有效。8.一种二手商品特征挖掘系统,其中包括:文本获取模块,经配置以读取商品质检报告,从中获取文本信息;
特征提取模块,其与所述文本获取模块相连接,经配置以从所述文本信息中提取一个或多个待定商品特征;输入特征确定模块,其与所述特征提取模块相连接,经配置以将所述待定商品特征增加到功能模型的第一信息特征集合中构成第二信息特征集合;模型评估模块,其与所述输入特征确定模块相连接,经配置以将所述第一信息特征集合和所述第二信息特征集合分别作为所述功能模型输入,以得到第一预测评...

【专利技术属性】
技术研发人员:郭辰
申请(专利权)人:北京转转精神科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1