The invention belongs to the field of computer technology, in particular to an information push method based on large data analysis, a computer readable storage medium and a server. The method receives the registration instruction sent by the first user through the terminal device and extracts the industry label of the first user from the registration instruction; receives the shared information set issued by the second user through the terminal device, and the industry label of the second user is the same as the industry label of the first user; and delineates the information in the shared information set according to the keyword. The matching degree between the first user and each information category is calculated, and the top P information categories with the highest matching degree are selected as the preferred information category and pushed to the terminal device of the first user. In this way, the information that users are not interested in is shielded, and the information of the industry that users are interested in is pushed to users, which greatly improves the user's experience.
【技术实现步骤摘要】
一种信息推送方法、计算机可读存储介质及服务器
本专利技术属于计算机
,尤其涉及一种信息推送方法、计算机可读存储介质及服务器。
技术介绍
随着移动互联网技术的飞速发展,网络上的信息呈现出了几何增长的态势,用户为了更好的了解行业信息,需要及时的获取与自身行业相关的信息,但这些信息往往会淹没在海量的网络信息中,用户没有时间和精力从各种推送信息中筛选出符合自身行业相关的信息。
技术实现思路
有鉴于此,本专利技术实施例提供了一种信息推送方法、计算机可读存储介质及服务器,以解决现有技术中用户没有时间和精力从各种推送信息中筛选出符合自身行业相关的信息的问题。本专利技术实施例的第一方面提供了一种信息推送方法,可以包括:接收第一用户通过终端设备发送的注册指令,并从所述注册指令中提取所述第一用户的行业标签;接收第二用户通过终端设备发布的共享信息集合,所述第二用户为除所述第一用户之外的其他用户,且所述第二用户的行业标签与所述第一用户的行业标签相同;将所述共享信息集合中的各条信息按照关键词划分为各个信息类别,并分别计算所述第一用户与各个信息类别之间的匹配度;选取匹配度最高的前P个信息类别作为优选信息类别,并将所述共享信息集合中信息类别为所述优选信息类别的信息推送至所述第一用户的终端设备,其中,P为正整数。本专利技术实施例的第二方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:接收第一用户通过终端设备发送的注册指令,并从所述注册指令中提取所述第一用户的行业标签;接收第二用户通过终端设备发布的共享信息集合,所 ...
【技术保护点】
1.一种信息推送方法,其特征在于,包括:接收第一用户通过终端设备发送的注册指令,并从所述注册指令中提取所述第一用户的行业标签;接收第二用户通过终端设备发布的共享信息集合,所述第二用户为除所述第一用户之外的其他用户,且所述第二用户的行业标签与所述第一用户的行业标签相同;将所述共享信息集合中的各条信息按照关键词划分为各个信息类别,并分别计算所述第一用户与各个信息类别之间的匹配度;选取匹配度最高的前P个信息类别作为优选信息类别,并将所述共享信息集合中信息类别为所述优选信息类别的信息推送至所述第一用户的终端设备,其中,P为正整数。
【技术特征摘要】
1.一种信息推送方法,其特征在于,包括:接收第一用户通过终端设备发送的注册指令,并从所述注册指令中提取所述第一用户的行业标签;接收第二用户通过终端设备发布的共享信息集合,所述第二用户为除所述第一用户之外的其他用户,且所述第二用户的行业标签与所述第一用户的行业标签相同;将所述共享信息集合中的各条信息按照关键词划分为各个信息类别,并分别计算所述第一用户与各个信息类别之间的匹配度;选取匹配度最高的前P个信息类别作为优选信息类别,并将所述共享信息集合中信息类别为所述优选信息类别的信息推送至所述第一用户的终端设备,其中,P为正整数。2.根据权利要求1所述的信息分享方法,其特征在于,所述分别计算所述第一用户与各个信息类别之间的匹配度包括:从预设的数据库中查询所述第一用户在预设的统计时间段内的历史反馈记录;将所述统计时间段划分为T个子时段,其中,T为正整数;从所述历史反馈记录中分别提取在各个子时段内所述第一用户对各个信息类别的历史信息的反馈结果,并根据所述反馈结果计算各条历史信息的得分;根据下式分别计算所述第一用户与各个信息类别之间的匹配度:其中,c为信息类别的序号,1≤c≤ClassNum,ClassNum为信息类别的总数,t为子时段的序号,1≤t≤T,n为信息的序号,1≤n≤Nc,t,Nc,t为所述第一用户在第t个子时段内接收到的第c个信息类别的信息的总次数,InfoScorec,t,n为第t个子时段内第c个信息类别的第n条信息的得分,exp为自然指数函数,MatchDegc为所述第一用户与第c个信息类别之间的匹配度。3.根据权利要求1所述的信息分享方法,其特征在于,所述选取匹配度最高的前P个信息类别作为优选信息类别包括:将各个信息类别按照匹配度从大到小的顺序依次排列为如下的序列:{MatchDeg1、MatchDeg2、……、MatchDegks、……、MatchDegClassNum}其中,ks为匹配度按照从大到小的顺序依次排列的序号,1≤ks≤ClassNum,ClassNum为信息类别的总数目,MatchDegks为排序在第ks位的匹配度;将满足下式的KN的取值确定为候选信息类别的个数:其中,DegThresh为预设的匹配度阈值;将满足下式的P的取值确定为优选信息类别的个数:P=max(MinNum,min(KN,MaxNum))其中,MaxNum=ceil(WeightMax×ClassNum),MinNum=ceil(WeightMin×ClassNum),ceil为向上取整函数,WeightMax、WeightMin均为预设的比例系数,且0<WeightMin<WeightMax<1,min为求最小值函数,max为求最大值函数。4.根据权利要求1所述的信息推送方法,其特征在于,所述将所述共享信息集合中的各条信息按照关键词划分为各个信息类别包括:确定与各个信息类别分别对应的关键词集合,并分别计算每个关键词集合中的各个关键词的分类辨识度;分别统计各个关键词在各条信息中出现的频次;根据下式分别计算所述共享信息集合中的各条信息属于各个信息类别的概率值:其中,c为信息类别的序号,1≤c≤ClassNum,ClassNum为信息类别的总数,kn为关键词的序号,1≤kn≤KwNumc,KwNumc为与第c个信息类别对应的关键词集合中的关键词总数,MsgKWNumc,kn,m为与第c个信息类别对应的关键词集合中的第kn个关键词在第m条信息中出现的频次,ClassDegc,kn为与第c个信息类别对应的关键词集合中的第kn个关键词的分类辨识度,Probabilityc,m为所述共享信息集合中的第m条信息属于第c个信息类别的概率值;按照下式将所述共享信息集合中的各条信息分别划分到概率值最高的信息类别中:TargetClassm=argmax(Probability1,m,Probability2,m,...,Probabilityc,m,,...,ProbabilityClassNum,m)其中,argmax为最大自变量函数,TargetClassm为所述共享信息集合中的第m条信息划分到的信息类别的序号。5.根据权利要求4所述的信息推送方法,其特征在于,所述确定与各个信息类别分别对应的关键词集合,并分别计算每个关键词集合中的各个关键词的分类辨识度包括:对预设的语料库中的各条语料进行切词处理,得到各个词语,所述语料库中包括与各个信息类别分别对应的语料子库;分别统计各个词语在各个语料子库中出现的频次;根据下式分别计算各个词语的分类辨识度:其中,w为词语的序号,1≤w≤WordNum,WordNum为词语的总数目,FreqSeqw为第w个词语在各个语料子库中出现的频次序列,且FreqSeqw=[Freqw,1,Freqw,2,......,Freqw,c,......,Freqw,ClassNum],Freqw,c为第w个词语在与第c个信息类别对应的语料子库中出现的频次,FreqSeq′w为从FreqSeqw中去除掉最大取值后剩余的序列,即:FreqSeq′w=FreqSe...
【专利技术属性】
技术研发人员:刘金满,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。