一种计算电商直播热度的方法及系统技术方案

技术编号:38027789 阅读:9 留言:0更新日期:2023-06-30 10:54
本发明专利技术涉及数据处理技术领域,具体地说,涉及一种计算电商直播热度的方法及系统。包括以下步骤:采集直播数据进行数据清洗、去重和降采样的预处理,采用加权增量模型,根据直播数据计算实时的直播热度指数,并且应用支持向量回归机算法,建立历史数据分析模型,判断观看者对直播感兴趣的内容,预测未来的直播热度。本发明专利技术能够更为准确地计算出实时的直播热度指数,使得直播热度指数更具备代表性和精准性,提高电商直播的营销策略和效果,并且根据评论数量对所有分类按照兴趣程度进行排序,方便直播者可以根据咨询问题数量较多的优先进行解答,满足大部分观看者的需求,提高直播质量,实现直播热度评估体系的个性化定制。实现直播热度评估体系的个性化定制。实现直播热度评估体系的个性化定制。

【技术实现步骤摘要】
一种计算电商直播热度的方法及系统


[0001]本专利技术涉及数据处理
,具体地说,涉及一种计算电商直播热度的方法及系统。

技术介绍

[0002]随着电商网络化经营的快速发展,直播电商正在迅速成为电商行业的一大风口,直播电商将传统线下购物与线上购物方式相结合,提供强大的网购体验,因此,投入大量资源来发展直播电商,而电商直播的重要指标之一便是直播热度,通过对直播热度的准确计算和分析,可以有效地评估直播质量,优化营销方案,提升用户购买转化率;然而目前在对直播热度进行计算及分析时,存在以下问题:其一、传统的直播热度指标粗略和有限,不能反映出直播热度的实际情况,也难以满足直播电商的实际需求;其二、直播电商面对大量的用户咨询和服务工作,需要快速响应和处理,但是传统的手工处理方式难以胜任;其三、直播热度的计算和分析需要耗费大量的时间和人力,不能实现实时追踪和有效评估;鉴于此,提出一种计算电商直播热度的方法及系统,解决了传统的直播热度计算和分析使用的问题,对于促进直播电商行业的发展具有积极的作用。

技术实现思路

[0003]本专利技术的目的在于提供计算电商直播热度的方法及系统,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述技术问题的解决,本专利技术的目的之一在于,提供一种计算电商直播热度的方法,包括如下步骤:S1、采集电商直播平台的直播数据,直播数据包括直播标题、观看次数、点赞数、评论数、分享数;S2、对采集到的直播数据进行数据清洗、去重和降采样的预处理;S3、采用加权增量模型,根据直播数据计算实时的直播热度指数;S4、应用支持向量回归机算法,建立历史数据分析模型,判断观看者对直播感兴趣的内容,预测未来的直播热度;S5、建立直播感兴趣内容的分析表,根据预测未来的直播热度实现直播热度评估体系的个性化定制。
[0005]优选的,所述S1中采集直播数据是通过API接口实时获取电商直播平台的直播数据。
[0006]优选的,所述S2中对直播数据进行数据清洗包括以下步骤:去除数据中的空格和空行:使用 strip 函数或者正则表达式去除字符串两端的空格,删除空行;
处理数据中的异常值;处理数据中的缺失值:对于缺失值,采用插值法和删除法处理;所述S2中对直播数据进行数据去重包括以下步骤:使用Pandas库中的drop_duplicates 函数,对直播数据的唯一属性进行检测,去除重复的记录数据;所述S2中对直播数据进行降采样包括以下步骤:定义时间间隔;对于每个时间间隔内的数据,采用平均值或者中位数来代替原始数据。
[0007]优选的,所述S3中加权增量模型包括以下步骤:将直播数据指标赋予权重并加以计算;根据权重和各项指标的增量,计算出实时的直播热度指数。
[0008]优选的,具体的,所述加权增量模型的表达式为:定义若干个时间段[ti, t{i+1}];在时间段[ti, t{i+1}]中,直播间的热度指数H(t)的计算采用加权平均值的方法,即:H(t)=α*H(t

1)+(1

α)* W(t

1)*W(t) ;其中,H(t

1)表示上一个时间段的热度指数,W(t

1)表示上一个时间段中用户在该时间对直播间互动的权重,W(t)表示当前时刻用户在该时间段内对直播间互动的权重,而α是平滑系数,其作用是对历史权重进行平滑处理。
[0009]优选的,所述S4中支持向量回归机算法,包括以下步骤:S4.1、首先需要对历史的直播数据进行处理,提取出特征向量,并将这些特征向量组成历史数据的特征矩阵x = [x1, x2, ..., xn]^T,其中n表示历史数据的数量;S4.2、设历史直播数据的指数序列为y= [y1, y2, ..., yn]^T,其取值范围为实数空间;S4.3、对于SVR模型,需要选择一个核函数用于将特征向量映射到高维空间,并根据模型需要来选择相应的核函数,其公式如下:K(xi,xj) = exp(

\gamma||xi

xj||^2);其中,xi,xj表示样本数据的特征向量,\gamma是一个可控制模型复杂度和训练误差的正则化参数;||xi

xj||^2是样本数据特征向量之间的欧几里得距离;S4.4、建立支持向量回归机模型,其基本公式为:y=w^T\phi(x)+b;其中,\phi(x)表示将输入空间x映射到高维空间过程中使用的核函数,w表示模型的权重,b表示模型的偏置;S4.5、对于给定的一组特征向量xp,使用支持向量回归机模型预测其所对应的直播热度指数 yp,其表示为:yp = w^T\phi(xp)+b;S4.6、采用机器学习库对模型进行训练和预测。
[0010]优选的,所述S4中判断观看者对直播感兴趣的内容采用关键字分类排序算法,包括以下步骤:评论内容进行分词处理,将每个评论划分为一个个词语;
接着,建立一个包含关键字的列表或词典,将其中的关键字分为不同的分类。
[0011]针对评论中的每个词语,使用模糊字符串匹配算法,与关键字列表中的所有词进行匹配,找出与分类相关联的评论;将每个评论分别计算相关联的分类的权重得分;将每个评论分别归类到相关的分类,统计每个分类在所有评论中出现的次数,再按照出现次数进行排序,得到观看者最感兴趣的分类。
[0012]优选的,所述关键字分类排序算法的表达式为:对于每条评论Cj,计算其与各个分类Ti的权重得分W{i,j},用于表示评论和各个主题的语义相关性,其公式如下:W{i,j} =sum{k=1}^n mi(c{j,k});其中,mi(c{j,k})表示第j条评论Cj中第k个词语对应的分类Ti的权重,n表示评论Cj内词语的数量;对于每个分类Ti,统计所有评论中与其相关联的权重得分,表示观众对该分类的总体兴趣程度Ii,其公式如下:Ii =sum{j=1}^m W{i,j};其中,m表示评论数量。
[0013]本专利技术的目的之二在于,提供了计算电商直播热度的系统,包括上述中任意一项所述的计算电商直播热度的方法,包括直播数据收集模块、数据预处理模块、直播热度计算模块和预测分析模块和定制分析模块;所述直播数据收集模块用于采集电商直播平台的直播数据;所述数据预处理模块用于对采集到的直播数据进行数据清洗、去重和降采样的预处理;所述直播热度计算模块用于根据直播数据计算实时的直播热度指数;所述预测分析模块用于建立历史数据分析模型,判断观看者对直播感兴趣的内容,预测未来的直播热度;所述定制分析模块用于直播感兴趣内容的分析表,根据预测未来的直播热度实现直播热度评估体系的个性化定制。
[0014]与现有技术相比,本专利技术的有益效果:1、通过采集电商直播平台的直播数据,对采集到的直播数据进行数据清洗、去重和降采样的预处理,然后采用加权增量模型,根据直播数据计算实时的直播热度指数,利用加权增量模型,能够更为准确地计算出实时的直播热度指数。通过对观看次数、点赞数、评论数、分享数等多个指标进行分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算电商直播热度的方法,其特征在于:包括如下步骤:S1、采集电商直播平台的直播数据,直播数据包括直播标题、观看次数、点赞数、评论数、分享数;S2、对采集到的直播数据进行数据清洗、去重和降采样的预处理;S3、采用加权增量模型,根据直播数据计算实时的直播热度指数;S4、应用支持向量回归机算法,建立历史数据分析模型,判断观看者对直播感兴趣的内容,预测未来的直播热度;S5、建立直播感兴趣内容的分析表,根据预测未来的直播热度实现直播热度评估体系的个性化定制。2.根据权利要求1所述的计算电商直播热度的方法,其特征在于:所述S1中采集直播数据是通过API接口实时获取电商直播平台的直播数据。3.根据权利要求2所述的计算电商直播热度的方法,其特征在于:所述S2中对直播数据进行数据清洗包括以下步骤:去除数据中的空格和空行:使用 strip 函数或者正则表达式去除字符串两端的空格,删除空行;处理数据中的异常值;处理数据中的缺失值:对于缺失值,采用插值法和删除法处理;所述S2中对直播数据进行数据去重包括以下步骤:使用Pandas库中的drop_duplicates 函数,对直播数据的唯一属性进行检测,去除重复的记录数据;所述S2中对直播数据进行降采样包括以下步骤:定义时间间隔;对于每个时间间隔内的数据,采用平均值或者中位数来代替原始数据。4.根据权利要求1所述的计算电商直播热度的方法,其特征在于:所述S3中加权增量模型包括以下步骤:将直播数据指标赋予权重并加以计算;根据权重和各项指标的增量,计算出实时的直播热度指数。5.根据权利要求4所述的计算电商直播热度的方法,其特征在于:所述加权增量模型的表达式为:定义若干个时间段[ti, t{i+1}];在时间段[ti, t{i+1}]中,直播间的热度指数H(t)的计算采用加权平均值的方法,即:H(t)=α*H(t

1)+(1

α)* W(t

1)*W(t) ;其中,H(t

1)表示上一个时间段的热度指数,W(t

1)表示上一个时间段中用户在该时间对直播间互动的权重,W(t)表示当前时刻用户在该时间段内对直播间互动的权重,而α是平滑系数,其作用是对历史权重进行平滑处理。6.根据权利要求1所述的计算电商直播热度的方法,其特征在于:所述S4中支持向量回归机算法,包括以下步骤:S4.1、首先需要对历史的直播数据进行处理,提取出特征向量,并将这些特征向量组成历史数据的特征矩阵x= [x1, x2, ..., xn]^T,其中n表示历史数据的数量;S4.2、设历史直播数据的指数序列为y= [y1, y2, ..., yn]^T,其取值范围为实数空
间;S4.3、对于SVR模型,需要选择一个核函...

【专利技术属性】
技术研发人员:王樱颐
申请(专利权)人:深圳市兴意腾科技电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1