System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及大数据信息推送,尤其涉及一种基于大数据的资讯信息提取推送方法及系统。
技术介绍
1、移动互联网的快速发展推动了数据的高效传播,产生信息过载,用户无法有效的对信息进行筛选,导致用户与推送信息的不匹配。为了解决用户与信息的匹配问题,通过建立用户画像进行信息推送。资讯信息推送是通过大量的数据挖掘分析出用户潜在的兴趣爱好,使推送服务从被动推送、用户要求转向主动推送,并且针对不同用户的不同兴趣进行性化推送。
2、用户画像是以不同方式勾画用户角色、阐明用户需求、联系用户兴趣的一种有效工具,但是现有的用户画像建立在采集时未考虑时效性和易变性的动态数据、和用户关联程度和统一程度较为紧密的多样数据,导致信息采集不彻底,用户画像构造不准确,推送信息与目标信息不相符,而且用户兴趣爱好是随着时间进行变换,但是用户画像未考虑及时更新,导致根据用户画像推荐咨询信息精度较低,存在很大偏差,用户满意度降低,降低信息技术服务企业与用户之间的联系,使相关企业无法及时满足用户需求,可以对用户的不同兴趣进行性化推送。
技术实现思路
1、本公开实施例提供了一种基于大数据的资讯信息提取推送方法及系统,解决了未考虑时效性和易变性的动态数据、和用户关联程度和统一程度较为紧密的多样数据,导致信息采集不彻底,用户画像构造不准确,推送信息与目标信息不相符问题和用户画像未考虑及时更新的问题。提高了用户信息采集的全面性,提高户画像构造准确性,充分贴近用户实际生活,用户画像推荐咨询信息精度提高,提高用户满意度,提高信息
2、本专利技术提供一种基于大数据的资讯信息提取推送方法,包括:根据用户动态信息和静态信息的权重采集并去噪后自成标签得到用户画像;通过用户画像将不同时刻标签进行集合并将同一标签根据时间序列进行整合并通过更新模型更新用户画像得到动态用户画像;动态用户画像进行种群化并通过调整个体的权重并通过偏差和偏度进行优化得到聚类中心并计算与各标签之间距离进行分类得到群组用户画像;根据用户对推送信息的评分并通过相识度计算并通过评分公式选取推送信息集合提取群组用户画像兴趣标签通过更新模型并二次计算相似度并二次计算评分进行排序得到推送信息。
3、在一个实施例中,所述根据用户动态信息和静态信息的权重采集并去噪后自成标签得到用户画像,包括:
4、对用户动态信息和静态信息以及用户关联程度和统一程度紧密的多样数据进行空间和时间采集,其中空间采集公式为
5、
6、时间采集公式为
7、
8、对空间和时间采集的数据进行分解计算瞬时频率来捕捉噪声信号并通过卷积标注噪声数据段后通过分量重构进行去噪自成标签得到用户画像,其中,对空间和时间采集的数据通过分解公式进行分解为
9、
10、分解后通过瞬时频率度量公式计算瞬时频率来捕捉噪声信号
11、
12、将捕捉噪声信号数据段通过卷积进行标注
13、n=z′×δ(τ)
14、将含有噪声的数据段进行剔除,通过分量重构进行去噪
15、
16、其中,αi表示信息缺省值,αj表示用户初始化兴趣集,q表示用户浏览的页面文本,xij表示用户历史行为,f1表示网站访问数据量,xi表示用户重返网站次数占总访问次数的比值,f2表示动态本体权重,xj表示静态本体权重,y2表示用户心理趋势,n表示搜索引擎响应时长,σ表示数据源独立性,mi表示用户数据分析的信用度,io表示用户反馈产生的互动数据流,δs表示用户行为内在变化,s2表示用户行为发展规律,bxmple表示数据长度,pp'表示噪声信号固有频率,pik表示数据分量的共轭分布关系,a表示互联网随机行为占总数据分量的百分比,e表示监测点,表示噪声污染度,γ2表示分量突变概率,l表示通过时间采集公式采集的用户时间信息,h表示通过空间采集公式采集的用户空间信息,a表示空间和时间采集的用户信息通过分解公式分解得到用户信息分量,d表示用户信息分量的瞬时频率,表示包含有用信息的有效模态分量,yn表示包含无用信息的无效模态分量,yn+1表示用户信息平滑度,表示噪声信号对度量过程的干扰强度,θj表示实际变形数据,am表示间断合成分量,km+1表示度量时间踓,δ表示度量时间间隔,z'表示用户行为接触点,δ(τ)表示卷积符号的先验参数,n表示被标注含噪声的数据段,g表示初始噪声幅值,j表示去噪用户信息理论值,o表示噪声信号波形,b表示噪声信号频谱,im表示重构指征,v表示自适应分量叠加准则。
17、在一个实施例中,所述通过用户画像将不同时刻标签进行集合并将同一标签根据时间序列进行整合并通过更新模型更新用户画像得到动态用户画像,包括:
18、通过用户画像将不同时刻标签进行集合,假设t1时刻向量标签
19、将同一个兴趣标签按照时间序列进行整合,形成集合并通过更新模型更新用户画像得到动态用户画像,其中时间序列为
20、s=t*j*c*r
21、其中,s表示时间序列模型,t表示长期趋势特征,j表示季节性变化因素,c表示周期性变化,r表示随机干扰因素。
22、在一个实施例中,所述更新模型,包括:
23、更新模型为
24、ft+1=αst+(1-α)ft
25、其中,α表示,st表示t时刻的用户画像标签的观测值,ft表示t时刻的用户画像标签的更新值,ft+1表示t+1的用户画像标签的更新值。
26、在一个实施例中,所述动态用户画像进行种群化并通过调整个体的权重并通过偏差和偏度进行优化得到聚类中心并计算与各标签之间距离进行分类得到群组用户画像,包括:
27、动态用户画像标签进行种群化,初始化个体速度
28、
29、计算适应度值,确定自然簇质心初步位置
30、
31、抽样判定个体是否需要扰动,若扰动,编码个体并检测其扰动维度更新个体聚类中心位置
32、
33、判断迭代次数是否大于最大迭代次数,如果满足条件,则输出初步聚类中心选择结果,如果不满足重复上述步骤,其中聚类中心选择公式为
34、
35、对初步聚类中心选择结果通过偏差和偏度进行优化得到聚类中心;
36、分别计算聚类中心到各个标签数据之间的距离,并且将距离中心近的列标签数据进行归于一类并通过k聚类得到该类标签数据聚类中心,统计类别总数得到群组用户画像;
37、其中,ζ表示常数,ui表示个体i经过的最好位置的第c维分量,表示第e次迭代时个体i位置矢量的第c维分量,m,n分别表示权重系数的上下限,f(e)表示全局最优个体的自适应度值,f'(e)表示当前个体最优适应度值,α表示个体平均分布密度,g表示总迭代次数,ri表示个体群的个体数目,rj表示当前个体的平均适应度,g表示聚类中心选择值。
38本文档来自技高网...
【技术保护点】
1.一种基于大数据的资讯信息提取推送方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据用户动态信息和静态信息的权重采集并去噪后自成标签得到用户画像,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过用户画像将不同时刻标签进行集合并将同一标签根据时间序列进行整合并通过更新模型更新用户画像得到动态用户画像,包括:
4.根据权利要求3所述的方法,其特征在于,所述更新模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述动态用户画像进行种群化并通过调整个体的权重并通过偏差和偏度进行优化得到聚类中心并计算与各标签之间距离进行分类得到群组用户画像,包括:
6.根据权利要求5所述的方法,其特征在于,所述对初步聚类中心选择结果通过偏差和偏度进行优化得到聚类中心,包括:
7.根据权利要求6所述的方法,其特征在于,所述根据用户对推送信息的评分并通过相识度计算并通过评分公式选取推送信息集合提取群组用户画像兴趣标签通过更新模型并二次计算相似度并二次计算评分进行排序得到推送信息,包括:<
...【技术特征摘要】
1.一种基于大数据的资讯信息提取推送方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据用户动态信息和静态信息的权重采集并去噪后自成标签得到用户画像,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过用户画像将不同时刻标签进行集合并将同一标签根据时间序列进行整合并通过更新模型更新用户画像得到动态用户画像,包括:
4.根据权利要求3所述的方法,其特征在于,所述更新模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述动态用户画像进行种群化并通过调整个体的权重并通过偏差和偏度进行优化得到聚类中心并计算与各标签之间距离进行分类得到群组用户画像,包括:
6.根据权利要求5所述的方法,其特征在于,所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。