一种二手电商场景下的低质商品挖掘方法和系统技术方案

技术编号:37171823 阅读:12 留言:0更新日期:2023-04-20 22:42
本发明专利技术涉及一种二手电商场景下的低质商品挖掘方法和系统,所述方法包括:获取目标商品的挖掘物料,所述挖掘物料包括当前所属商品类目、价格、标题及文字描述;根据当前所属商品类目确定多种低质挖掘模板;将所述目标商品的挖掘物料分别与每个种类的一个或多个低质挖掘模板进行匹配;以及响应于匹配到的低质挖掘模板,确定所述目标商品为低质挖掘模板定义的低质商品并确定对应的低质内容。本发明专利技术针对不同种类的低质商品,采用对应的模板识别,识别内容针对性强,挖掘结果准确;通过对低质商品的处理降低了低质商品为用户和平台带来的潜在风险,有效地提升了用户对平台的信任度,提高了用户的存留率。高了用户的存留率。高了用户的存留率。

【技术实现步骤摘要】
一种二手电商场景下的低质商品挖掘方法和系统


[0001]本专利技术涉及互联网应用
,特别地涉及一种二手电商场景下的低质商品挖掘方法和系统。

技术介绍

[0002]随着互联网应用及物流行业的发展,越来越多的商家与消费者倾向于在电子商业平台完成相应的交易。相应地,二手电商平台也逐渐发展起来,成为人们处理闲置物品的一种好的方式。二手电商平台与普通的一手电商平台一个显著的区别就是二手商品差异大、非标性强,即使是同一类商品,由于各种不同的使用情况,商品的实际情况也具有较大的差异。由于大部分的商品是经过使用的,因而存在不同程度的磨损,甚至存在损坏、某些功能不可用的情况。例如,对于3C产品(对电脑及其周边通讯和消费电子(Computer,Communications,Consumer

Electronics)三种家用电器的总称)而言,屏幕损伤、机体磨损等是普遍容易存在的问题。又例如普通商品在外观上存在的破损、裂痕以及商品无法正常使用等。对于普通买家而言,即使是想买二手产品,大部分用户也不会希望买个破旧、功能受限的商品,当用户访问二手电商平台、看到的商品大部分都是具有一定程度损坏的商品时,会对该二手电商平台产生不好的印象,进而会影响用户的留存比例以及后续流程的转化。另外,由于各种原因,平台上出售的商品可能有价格异常的情况。例如1元钱的汽车,15元的全新游戏键盘等。异常的商品价格有可能是骗子发布或商品本身存在问题,或者在采用低价吸引流量等原因,很有可能会给买家用户带来损失,导致用户对平台的信任下降、体验差,进而导致用户流失。再有,当平台上的商品类目错误时会影响后续搜索推荐算法的准确性。对于同城商品,在将同城商品无差别展示时会浪费平台流量。
[0003]综上所述,由于各种原因导致二手平台上一些商品成为低质商品,低质商品或者有给用户造成损失的可能性,进而影响用户体验,导致用户流失;或者影响平台为用户提供的服务,导致推荐的商品不准确、浪费平台流量。

技术实现思路

[0004]针对现有技术中存在的技术问题,本专利技术提出了一种二手电商场景下的低质商品挖掘方法和系统,用以识别出平台中存在的低质商品。
[0005]为了解决上述技术问题,根据本专利技术的一个方面,本专利技术提供了一种二手电商场景下的低质商品挖掘方法,其中包括以下步骤:
[0006]获取目标商品的挖掘物料,所述挖掘物料包括目标商品当前所属商品类目、价格、标题及文字描述;
[0007]根据当前所属商品类目确定多种低质挖掘模板;
[0008]将所述目标商品的挖掘物料分别与每个种类的一个或多个低质挖掘模板进行匹配;以及
[0009]响应于匹配到的低质挖掘模板,确定所述目标商品为低质挖掘模板定义的低质商
品并确定对应的低质内容。
[0010]根据本专利技术的另一个方面,本专利技术提供了一种二手电商场景下的低质商品挖掘系统,其包括数据获取模块、模板模块和匹配模块,其中,所述数据获取模块获取目标商品的挖掘物料,所述挖掘物料包括当前所属商品类目、价格、标题及文字描述;所述模板模块提供对应商品类目的多种低质挖掘模板;所述匹配模块分别与所述数据获取模块和模板模块相连接,将所述目标商品的挖掘物料分别与每个种类的一个或多个低质挖掘模板进行匹配;在匹配到低质挖掘模板时确定所述目标商品为低质挖掘模板定义的低质商品并确定对应的低质内容。
[0011]本专利技术针对不同种类的低质商品,采用对应的模板识别,识别内容针对性强,挖掘过程简单、识别准确度高。在识别出低质商品后,平台可依据低质种类采用对应的策略以降低低质商品为用户和平台带来的潜在风险,从而有效地提升用户对平台的信任度,提高了用户的存留率。
附图说明
[0012]下面,将结合附图对本专利技术的优选实施方式进行进一步详细的说明,其中:
[0013]图1是根据本专利技术的一个实施例的二手电商场景下的低质商品挖掘方法流程图;
[0014]图2是根据本专利技术的一个实施例的构造缺陷商品识别模板的方法流程图;
[0015]图3是根据本专利技术的一个实施例的二手电商场景下的缺陷商品挖掘方法流程图;
[0016]图4是根据本专利技术的一个实施例的二手电商场景下的获取合理商品价格区间最低价格的方法流程图;
[0017]图5是根据本专利技术的一个实施例的二手电商场景下挖掘类目错误的商品方法流程图;
[0018]图6是根据本专利技术的一个实施例的二手电商场景下的低质商品挖掘系统原理框图;
[0019]图7是根据本专利技术的一个实施例的模板模块和匹配模块的原理框图;
[0020]图8是根据本专利技术的一个实施例的第一类商品识别模板单元的原理框图;
[0021]图9是根据本专利技术另一个实施例的第一类商品识别模板单元的原理框图;以及
[0022]图10是根据本专利技术的一个实施例的商品价格模板单元原理框图。
具体实施方式
[0023]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。
[0025]为了减少低质商品对用户及二手电商平台的影响,本专利技术提供以下方案从平台现有的全量商品中识别出这些低质商品,并且在有新商品发布时,采用本专利技术的方案对其进行识别以确定其是否为低质商品。本专利技术中所述的低质商品包括损坏、功能不全的商品、价格异常的商品、同城交易的商品及商品发布时分类错误的商品。
[0026]图1是根据本专利技术一个实施例的二手电商场景下的低质商品挖掘方法流程图,其中包括以下步骤:
[0027]步骤S1,获取目标商品的挖掘物料,所述挖掘物料包括当前所属商品类目、价格、标题及文字描述。
[0028]步骤S2,根据当前所属商品类目确定对应的多个低质种类的低质挖掘模板,不同种类的低质挖掘模板对应识别不同种类的低质商品。
[0029]步骤S3,获取一种低质挖掘模板。针对不同低质内容,本专利技术设置有对应种类的低质模板,如第一类商品识别模板中的缺陷商品识别模板或同城商品识别模板、商品价格模板或商品类目模板,每个种类的模板又包括有一个或多个模板。
[0030]步骤S4,取该种模板中一个模板与所述目标商品的挖掘物料进行匹配。
[0031]步骤S5,判断是否与模板相匹配,或匹配到模板中的内容。如果匹配到,则在步骤S6中确定所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种二手电商场景下的低质商品挖掘方法,其中包括:获取目标商品的挖掘物料,所述挖掘物料包括目标商品当前所属商品类目、价格、标题及文字描述;根据当前所属商品类目确定多种低质挖掘模板;将所述目标商品的挖掘物料分别与每个种类的一个或多个低质挖掘模板进行匹配;以及响应于匹配到的低质挖掘模板,确定所述目标商品为低质挖掘模板定义的低质商品并确定对应的低质内容。2.根据权利要求1所述的方法,其中所述低质挖掘模板包括第一类商品识别模板,所述第一类商品识别模板至少包括表达低质内容的第一词汇。3.根据权利要求2所述的方法,其中所述第一类商品为缺陷商品或同城商品,对应地,第一类商品识别模板为缺陷商品识别模板或同城商品识别模板,所述第一词汇为表达质量缺陷的词汇或表达同城的词汇;在所述目标商品的挖掘物料匹配到缺陷商品识别模板或同城商品识别模板时,确定所述目标商品为质量缺陷商品或同城商品。4.根据权利要求3所述的方法,其中获取第一类商品识别模板的过程包括:获取多个正则模板,其中所述正则模板包括多个替换项及一个或多个固定项;获取一个或多个多元组;其中所述多元组为多个共同出现次数大于阈值的词汇,其中至少一个词汇为表达低质内容的第一词汇;以及将所述多元组中的多个词汇分别填入所述正则模板中对应的替换项,从而得到第一类商品识别模板。5.根据权利要求4所述的方法,其中包括以下数据准备步骤:获取全量挖掘物料,所述全量挖掘物料包括全量商品的所属商品类目、价格、标题及文字描述;从全量挖掘物料中识别出表达质量缺陷和同城的多个第一词汇;提取包括表达质量缺陷或同城第一词汇的商品的标题及文字描述,分别作为第一物料和第二物料;对所述第一物料和第二物料分别进行分词和去停用词处理;在同一商品类目的第一物料中统计出现次数大于第一阈值的多个第一分词;在第二物料中统计出现次数大于第一阈值的多个第一分词;以及在同一商品类目的第一物料中统计共同出现次数大于第二阈值的多个分词以得到商品多元组,其中所述商品多元组中至少一个分词为第一词汇;在第二物料中统计共同出现次数大于第二阈值的多个分词以得到同城多元组,其中所述同城多元组中至少一个分词为第一词汇。6.根据权利要求5所述的方法,其中所述数据准备步骤还包括:按照正则表达式规则构造包括多个替换项和一个或多个固定项的正则模板,其中,所述固定项为第一分词。7.根据权利要求5所述的方法,其中进一步地,通过关键字从全量挖掘物料的文字信息中识别出表达低质内容的多个第一词汇。8.根据权利要求1所述的方法,其中所述低质挖掘模板包括商品价格模板,所述商品价
格模板包括与商品类目相应的合理商品价格区间;采用与目标商品同类目的商品价格模板匹配目标商品价格;响应于目标商品价格位于所述合理商品价格区间外,确定所述目标商品为价格异常商品。9.根据权利要求8所述的方法,其中进一步包括获取合理商品价格区间的步骤:获取一个商品类目的x1%分位数位置商品对应的第一价格p1、x2%分位数位置商品对应的第二价格p2及阈值,其中x1<x2,0≤x≤100;查询该商品类目下价格低于第一价格p1的多个第一商品和价格高于第二价格p2的多个第二商品;从多个第一商品中确定价格最高的商品及对应的价格pt1,从多个第二商品中确定价格最低的商品及对应的价格pt2;分别计算第一价格p1与商品价格pt1的第一差值pd1;第二价格p2与商品价格pt2的第二差值pd2;分别比较第一差值pd1与阈值的大小,第二差值pd2与阈值的大小;响应于第一差值pd1小于阈值,使用所述商品价格pt1替换第一价格p1得到新的第一价格p1;响应于第二差值pd2小于阈值,使用所述商品价格pt2替换第二价格p2得到新的第二价格p2;以及直至没有满足上述条件的商品,将第一价格p1设置为合理商品价格区间最低价格,将第二价格p2设置为合理商品价格区间最高价格。10.根据权利要求1所述的方法,其中所述低质挖掘模板包括商品类目模板,所述商品类目模板包括分类器;在采用商品类目模板与挖掘物料进行匹配时,应用所述分类器根据挖掘物料对目标商品进行分类得到第一...

【专利技术属性】
技术研发人员:范天岳
申请(专利权)人:北京转转精神科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1