【技术实现步骤摘要】
基于大数据的信息推送方法
本专利技术涉及大数据处理
,尤其涉及一种基于大数据的信息推送方法。
技术介绍
随着互联网与信息技术的发展,用户获取信息的方式发生了巨大的变化。互联网上的信息量呈现出爆炸式增长,用户在海量信息中获取信息有一定的困难,因此,信息推送应运而生。信息推送能够将用户所需的信息直接推送到用户手中,缓解了信息过载。根据用户信息需求的显露方式不同,用户信息需求的显露方式分为用户信息需求的显示表达与隐式透露,因此将信息推送模式归纳为订阅式信息推送模式和迎合式信息推送模式。订阅式信息推送对应用户信息需求的显式表达。迎合式信息推送对应用户信息需求的隐式透露,隐式透露是用户浏览、点赞、发帖评论等行为间接透露出来的用户信息兴趣与阅读偏好。迎合式信息推送模式,依赖对已知身份用户的上述行为的持续不断跟踪。迎合式推送模式的核心思想是基于用户数据的获取,通过算法推荐为用户推送所需的信息,满足用户信息需求的个性化,但是用户兴趣偏好会随着时间推移发生变化,此时信息推送平台中对于用户历史数据的收集会存在一定的延迟,因此无法及 ...
【技术保护点】
1.一种基于大数据的信息推送方法,其特征在于,包括:/n采集用户的历史数据,基于历史数据设置用户画像,基于用户画像形成第一推送列表,所述第一推送列表中包含至少两条信息;/n接收用户输入的实时数据,比较实时数据与历史数据的相似度,根据每条历史数据的所述相似度确定实时数据的差异度,根据所述差异度从所述第一推送列表中提取其中的目标信息;/n将所述目标信息发给所述用户;/n所述比较实时数据与历史数据的相似度包括:历史数据包括N1,N2,N3…Nn多条信息,每条信息的长度分别为L1,L2,L3…Ln, 实时数据的长度设置为实时数据的长度ln,/n将每条信息的长度分别与实时数据的长度进 ...
【技术特征摘要】
1.一种基于大数据的信息推送方法,其特征在于,包括:
采集用户的历史数据,基于历史数据设置用户画像,基于用户画像形成第一推送列表,所述第一推送列表中包含至少两条信息;
接收用户输入的实时数据,比较实时数据与历史数据的相似度,根据每条历史数据的所述相似度确定实时数据的差异度,根据所述差异度从所述第一推送列表中提取其中的目标信息;
将所述目标信息发给所述用户;
所述比较实时数据与历史数据的相似度包括:历史数据包括N1,N2,N3…Nn多条信息,每条信息的长度分别为L1,L2,L3…Ln,实时数据的长度设置为实时数据的长度ln,
将每条信息的长度分别与实时数据的长度进行比较,若Li<实时数据的长度ln,则表示该条信息内不包含实时数据,属于第一相似度;
若Li≥实时数据的长度ln,则将满足长度要求的历史数据建立历史信息矩阵M(M1,M2…Mk),其中k<n,对于历史信息矩阵中的历史数据进行判断时,从历史信息Mi中的第1个字符开始,不间断选择n个字符,将n个字符与实时数据的字符分别进行比较,若n个字符中与实时数据的字符重合率小于95%则表示历史信息Mi中包含实时数据,表示该实时数据与历史数据有细微差异,属于第二相似度;
从历史信息Mi中的第2个字符开始,选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率小于95%则属于第二相似度;
从历史信息Mi中的第k个字符开始,选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率小于95%则属于第二相似度;
若n个字符中与实时数据的字符重合率大于等于95%则表示历史信息Mi中包含实时数据,表示该实时数据与历史数据无差异,属于第三相似度;
从历史信息Mi中的第2个字符开始,选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率大于等于95%则属于第三相似度;
从历史信息Mi中的第k个字符开始,选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率大于等于95%则属于第三相似度。
2.根据权利要求1所述的基于大数据的信息推送方法,其特征在于,
在确定历史信息内是否包含实时数据时,还包括:从历史信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率小于95%则属于第二相似度;
从历史信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率小于95%则属于第二相似度;
从历史信息Mi中的第k个字符开始,选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率小于95%则属于第二相似度;
在确定历史信息内是否包含实时数据时,还包括:从历史信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率大于等于95%则属于第三相似度;
从历史信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率大于等于95%则属于第三相似度;
从历史信息Mi中的第k个字符开始,选择n个字符,将n个字符与实时数据的字符进行比较,若n个字符中与实时数据的字符重合率大于等于95%则属于第三相似度。
3.根据权利要求2所述的基于大数据的信息推送方法,其特征在于,在比较的过程中,若历史信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是历史信息中包含实时数据,此时判定该历史信息Mi中不包含实时数据的字符。
4.根据权利要求3所述的基于大数据的信息推送方法,其特征在于,若对于历史信息Mi中选择的n个字符与实时数据的字符进行比较时,若n个字符中与实时数据的字符重合率小于等于95%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将...
【专利技术属性】
技术研发人员:缪茂争,魏士超,缪佳琳,
申请(专利权)人:温州行动者网络科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。