一种二手电商场景下卖家用户类型预估方法和系统技术方案

技术编号:37236711 阅读:26 留言:0更新日期:2023-04-20 23:18
本发明专利技术涉及一种二手电商场景下卖家用户类型预估方法和系统,其中所述方法包括:获取卖家用户在一段时期的行为数据,基于所述卖家用户的行为数据,利用机器学习模型预测卖家用户类型为个人的第一预测分值;获取卖家用户发布商品时使用的文本数据,基于所述文本数据,利用机器学习模型预测卖家用户类型为个人的第二预测分值;获取卖家用户发布商品时使用的图像数据,基于所述图像数据,利用机器学习模型预测卖家用户类型为个人的第三预测分值;综合所述第一预测分值、第二预测分值和第三预测分值以确定所述卖家用户的类型为个人或商家。本发明专利技术综合多方面数据以甄别平台卖家用户的类型为个人或是商家,预测能力强、准确度高、处理效率高。理效率高。理效率高。

【技术实现步骤摘要】
一种二手电商场景下卖家用户类型预估方法和系统


[0001]本专利技术涉及互联网应用
,特别地涉及一种二手电商场景下卖家用户类型预估方法和系统。

技术介绍

[0002]在二手电商综合平台上进行商品销售的卖家用户既有个人也有商家(如公司),交易模式既有C2C模式,即个人卖家将商品卖给个人买家的交易模式,也有C2B2C模式,即个人卖家将商品卖给商家,商家再将商品卖给个人买家的交易模式。为了提高平台用户的交易速度、交易额,平台向商家推送个人卖家的服务则应运而生。平台需要从众多的用户中甄别出个人卖家,保证个人卖家的召回率和准确率,才能有效服务于商家与个人卖家,提升用户体验,促进双方达成交易,并提升平台GMV。

技术实现思路

[0003]针对现有技术中存在的技术问题,本专利技术提出了一种二手电商场景下卖家用户类型预估方法和系统,用以甄别平台用户中的个人卖家。
[0004]为了解决上述技术问题,根据本专利技术的一个方面,本专利技术提供了一种二手电商场景下卖家用户类型预估方法,其中所述方法包括:获取卖家用户在一段时期的行为数据,基于所述卖家用户的行为数据,利用机器学习模型预测卖家用户类型为个人的第一预测分值;获取卖家用户发布商品时使用的文本数据,基于所述文本数据,利用机器学习模型预测卖家用户类型为个人的第二预测分值;获取卖家用户发布商品时使用的图像数据,基于所述图像数据,利用机器学习模型预测卖家用户类型为个人的第三预测分值;综合所述第一预测分值、第二预测分值和第三预测分值以确定所述卖家用户的类型为个人或商家。
[0005]为了解决上述技术问题,根据本专利技术的另一个方面,本专利技术提供了一种二手电商场景下卖家用户类型预估系统,其中包括数据获取模块、行为模块、文本模块、图像模块和预估模块,其中,所述数据获取模块经配置以获取卖家用户在一段时期的行为数据、卖家用户发布商品时使用的文本数据和图像数据,其中所述行为数据包括行为发生时间和行为类型,所述文本数据包括卖家用户发布的商品标题和/或卖家用户使用的昵称;所述行为模块与数据获取模块相连接,经配置以基于所述卖家用户的行为数据,利用机器学习模型预测卖家用户类型为个人的第一预测分值;所述文本模块与数据获取模块相连接,经配置以基于所述文本数据,利用机器学习模型预测卖家用户类型为个人的第二预测分值;所述图像模块与数据获取模块相连接,经配置以基于所述图像数据,利用机器学习模型预测卖家用户类型为个人的第三预测分值;所述预估模块与所述行为模块、文本模块和图像模块相连接,经配置以综合所述第一预测分值、第二预测分值和第三预测分值以确定所述卖家用户的类型为个人或商家。
[0006]本专利技术综合多方面数据以甄别平台卖家用户的类型为个人或是商家,预测能力强、准确度高、处理效率高。通过本专利技术所述的方法,提高了下游的向商家推荐个人卖家时
的召回率及召回准确率,从而有效地提高了平台用户体验,在促进双方达成交易的同时,也提升了平台的收益。
附图说明
[0007]下面,将结合附图对本专利技术的优选实施方式进行进一步详细的说明,其中:
[0008]图1是根据本专利技术的一个实施例提供的二手电商场景下卖家用户类型预估方法流程图;
[0009]图2是根据本专利技术的一个实施例提供的XGBoost模型建模过程流程图;
[0010]图3是根据本专利技术的一个实施例提供的对卖家用户类型进行预测的流程图;
[0011]图4是根据本专利技术的一个实施例提供的二手电商场景下卖家用户类型预估系统原理框图;
[0012]图5是根据本专利技术的一个实施例提供的数据获取模块的原理框图;
[0013]图6是根据本专利技术的一个实施例提供的行为模块的原理框图;
[0014]图7是根据本专利技术的一个实施例提供的文本模块的原理框图;
[0015]图8是根据本专利技术另一个实施例提供的文本模块的原理框图;
[0016]图9是根据本专利技术的一个实施例提供的图像模块的原理框图;
[0017]图10是根据本专利技术的一个实施例提供的预估模块的原理框图;以及
[0018]图11是根据本专利技术的一个实施例提供的另一种二手电商场景下卖家用户类型预估方法流程图。
具体实施方式
[0019]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。
[0021]本专利技术提供了一种二手电商场景下卖家用户类型预估方法和系统,从多个角度对一个卖家用户的类型进行预测,从而能够准确地识别出卖家用户的类型,从而可以在下游为商家推荐个人卖家时能够准确召回个人卖家用户。本专利技术从用户行为、用户发布商品时的文字及商品图像三个方面来识别卖家用户的类型,并通过机器学习模型来预估卖家用户的类型,因而,参照图1,图1是本实施例提供的二手电商场景下卖家用户类型预估方法流程图。所述预估方法包括以下步骤:
[0022]步骤S1a,收集数据以得到原始数据集。二手电商平台在数据库中维护有用户日志,平台侦测用户的日常行为并实时记录到用户日志中,因而,用户日志中以日志形式记录有用户的各种行为,如登录、查看、搜索、收藏、商品发布、咨询或答复咨询等,每当用户有以
上任意一种行为发生时,都记录为一条日志,每条日志包括行为发生时间、行为类型及对应的操作内容。在一个实施例中,根据平台数据数量读取最近30天或60天或90天的平台用户日志,从而得到多个用户的多条日志以构成原始数据集。
[0023]步骤S2a,对日志进行维度分析及标记。所述的维度包括行为发生时间、结束时间、行为类型及对应的操作内容等,操作内容例如为发布商品的商品标题、收藏的商品标题、收藏的卖家昵称等,通过为每条日志数据标记出所述的各种维度,以利于以后的数据处理。
[0024]步骤S3a,分别获取行为数据集、文本数据集和图像数据集。其中,为了满足各个模型的输入要求,分别对原始数据集中的数据进行提取、计算以得到不同的数据集。其中,为了根据用户行为进行预测,将原始数据中的数据按照预置的行为特征指标进行计算,针对于每个卖家用户得到多种行为特征,从而构成行为数据集。特征指标包括数量类指标和频率类指标。例如,统计同一种行为的次数,对应操作内容的数量,如发布的商品数量、商品成交量、咨询或答复咨询的次数等,又例如计算某种行为在不同时期发生频率,例如最近一周登录累计时长、最本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种二手电商场景下卖家用户类型预估方法,其中包括:获取卖家用户在一段时期的行为数据,基于所述卖家用户的行为数据,利用机器学习模型预测卖家用户类型为个人的第一预测分值;获取卖家用户发布商品时使用的文本数据,基于所述文本数据,利用机器学习模型预测卖家用户类型为个人的第二预测分值;获取卖家用户发布商品时使用的图像数据,基于所述图像数据,利用机器学习模型预测卖家用户类型为个人的第三预测分值;综合所述第一预测分值、第二预测分值和第三预测分值以确定所述卖家用户的类型为个人或商家。2.根据权利要求1所述方法,其中进一步包括基于所述卖家用户的行为数据获得所述卖家用户的行为特征的步骤:获取每条行为数据的多个维度信息,所述维度包括行为发生时间、行为类型及对应的操作内容;以及利用所述一个或多个维度信息依据预置的行为特征指标进行计算以得到多种行为特征。3.根据权利要求2所述方法,其中所述的行为类型包括登录、商品发布、商品/卖家查看、商品/卖家搜索、商品/卖家收藏、咨询或答复咨询中的一者或多者。4.根据权利要求2或3所述方法,其中所述的行为特征指标包括数量类指标和频率类指标。5.根据权利要求1所述方法,其中所述文本数据包括商品标题和/或卖家用户昵称。6.根据权利要求5所述方法,其中进一步包括:基于所述商品标题预测卖家用户类型为个人的第四预测分值;基于所述卖家用户昵预测卖家用户类型为个人的第五预测分值;以及计算第四预测分值和第五预测分值的加权平均值,以所述加权平均值作为第二预测分值。7.根据权利要求1或6所述方法,其中进一步包括:按照以下公式计算所述卖家用户的综合评分:Score=Sum(w1*actModel+w2*textModel+w3*picModel)其中,Score为综合评分;actModel为第一预测分值,textModel为第二预测分值,picModel为第三预测分值,w1、w2和w3分别为对应的权重;以及将所述卖家用户的综合评分与阈值进行比较,响应于所述综合评分大于或等于所述阈值,确定所述卖家用户为个人,响应于所述综合评分小于所述阈值,确定所述卖家用户为商家。8.一种二手电商场景下卖家用户类型预估系统,其中包括:数据获取模块,经配置以获取卖家用户在一段时期的行为数据、卖家用户发布商品时使用的文本数据和图像数据,其中所述行为数据包括行为发生时间和行为类型,所述文本数据包括卖家用户发布的商品标题和/或卖家用户使用的昵称;行为模块,其与数据获取模块相连接,经配置以基于所述卖家用户的行为数据,利用机器学习模型预测卖家用户类型为个人的第一预测分值;
文本模块,其与数据获取模块相连接,经配置以基于所述文本数据,利用机器学习模型预测卖家用户类型为个人的第二预测分值;图像模块,其与数据获取模块相连接,经配置以基于所述图像数据,利用机器学习模型预测卖家用户类型为个人的第三预测分值;以及预估模块,其与所述行为模块、文本模块和图像模块相连接,经配置以综合所述第一预测分值、第二预测分值和第三预测分值以确定所述卖家用户的类型为个人或商家。9.根据权利要求8所述的系统,其中所述数据获取模块包括:数据读取单元,...

【专利技术属性】
技术研发人员:张浩
申请(专利权)人:北京转转精神科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1