【技术实现步骤摘要】
用户关注指数生成方法、装置、设备及存储介质
[0001]本专利技术涉及数据分析
,尤其是一种使用LightGBM树模型对用户关注指数进行计算的方法、装置、电子设备及存储介质。
技术介绍
[0002]在互联网汽车销售领域,用户关注度指数是体现用户对汽车产品关注程度的衡量指标,通过用户关注度指数,可以比较直观的衡量不同产品的火热程度和优劣,可以为产品的运营和推广提供有效的指导数据,在不同车系之间,用户关注度指数主要用于本品和竞争产品的市场认可度对比,对竞争关系进行强弱分析,以及帮助企业制定有针对性的推广策略。
[0003]现有技术中,对用户关注度指数的计算主要存在着特征选择依赖于人工规则,导致特征选择不准确,特征的权重计算不合理,无法找到低关注度用户,无法分析造成低关注度的因素等,影响了对用户关注度指数计算的准确性。
[0004]因此,需要一种有效的用户关注度指数的生成方法,以解决现有技术中存在的问题。
技术实现思路
[0005]为此,本专利技术提供了一种用户关注指数生成方法、装置、电子设备 ...
【技术保护点】
【技术特征摘要】
1.一种用户关注指数生成方法,所述方法使用LightGBM树模型对用户关注度数据进行特征分析,计算所有特征的权重,利用特征权重和特征权重对应的用户关注度数据进行加权,获取用户的用户关注度分值和排名,所述方法包括步骤:对用户关注度数据进行特征分类,获取所选定特征分类在设定时间区间内的用户关注度样本数据,所述样本数据包括正样本数据和负样本数据;依据所述选定特征分类的用户关注度样本数据,对所述选定特征分类的用户关注度数据进行模型训练,获取每一个所述选定特征分类的特征权重;依据所述每一个所述选定特征分类的特征权重,计算每一个用户的用户关注度样本数据的用户关注度分值,并依据所述用户关注度分值对用户关注度进行置信区间筛选。2.如权利要求1所述的方法,其中,所述对用户关注度数据进行特征分类,获取所选定特征分类在设定时间区间内的用户关注度样本数据的步骤包括:获取设定时间区间内的用户关注度数据,所述用户关注度数据包括用户关注相关信息的访问次数、访问时长、搜索次数、比对次数;依据所述设定时间区间内的用户关注度数据,对用户关注度数据进行特征分类,所述特征分类包括依据用户访问相应数据库项目进行分类;依据所述用户关注度数据的特征分类,获取选定的一个或多个用户关注度特征分类;依据所述一个或多个用户关注度特征分类,获取所选定特征分类在设定时间区间内对应的数据库中用户关注度样本数据。3.如权利要求2所述的方法,其中,所述获取所选定特征分类在设定时间区间内对应的数据库中用户关注度样本数据的步骤包括:获取选定特征分类在设定时间区间内的用户关注度样本数据;设置所述用户关注度样本数据的样本标签;依据所述用户关注度样本数据中的访问次数及对应访问时间,获取在该用户的用户关注度样本数据中的搜索次数及对应的搜索时间;设置时间阈值,判定某一用户的用户关注度样本数据中访问时间与搜索时间的最小时间间隔;如果所述访问时间与搜索时间的最小时间间隔小于设置的时间阈值,则将该用户的样本数据设置为正样本数据;如果所述访问时间与搜索时间的最小时间间隔大于设置的时间阈值,则将该用户的样本数据设置为负样本数据。4.如权利要求1所述的方法,其中,所述依据所述选定特征分类的用户关注度样本数据,对所述选定特征分类的用户关注度数据进行模型训练,获取每一个所述选定特征分类的特征权重的步骤包括:依据所述选定特征分类的用户关注度样本数据,指定选定特征分类中的连续特征分类和离散特征分类,并配置所述选定特征分类的用户关注度样本数据的标签类型,所述标签类型包括正样本标签和负样本标签,所述正样本标签包括正样本数据,所述负样本标签包括负样本数据;使用LightGBM树模型对所述选定特征分类的用户关注度样本数据进行训练;观察所述LightGBM树模型的训练损失LOSS,对验证集的模型评估指标AUC进行验证;
保存训练完成的LightGBM树模型结果,并输出所述选定特征分类的重要性指标;对所有的选定特征分类的重要性指标进行归一化,得到每一个选定特征分类的特征权重。5.如权利要求4所述的方法,其中,所述使用LightGBM树模型对所述选定特征分类的...
【专利技术属性】
技术研发人员:李想,胡勇,甘孟壮,
申请(专利权)人:车智互联北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。