一种基于大数据的科普知识精准推送方法及系统技术方案

技术编号:39243286 阅读:8 留言:0更新日期:2023-10-30 11:55
本发明专利技术公开了一种基于大数据的科普知识精准推送方法及系统,精准推送方法包括以下步骤:S1:建立科普大数据库,科普大数据库包括请求匹配模块和推送匹配模块;S2:建立科普内容与个人信息的关系模型;S3:将个人信息作为请求标签,请求标签与关系模型进行匹配,提取匹配出的与请求标签对应的科普内容;S4:验证匹配的科普内容与新用户的匹配度,根据匹配度精准推送不同的科普内容。精准推送系统包括科普大数据库,科普大数据库包括登录模块、请求匹配模块、推送匹配模块和推送模块。本发明专利技术利用大数据库积累的历史用户阅读不同科普内容的信息,实现精准化的推送,更能留住客户群体,推送的科普内容更具有时效性,更符合用户的阅读意愿和兴趣。意愿和兴趣。意愿和兴趣。

【技术实现步骤摘要】
一种基于大数据的科普知识精准推送方法及系统


[0001]本专利技术涉及互联网科普知识领域,具体涉及一种基于大数据的科普知识精准推送方法及系统。

技术介绍

[0002]随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容大量非结构化数据和半结构化数据,这些数据可用于市场、用户群体的分析。在科普知识的宣传、普及领域,目前都是通过用户的主动获取,用户需要自己去筛选感兴趣的科普内容,并自己去寻找途径获取,用户的体验感差,阻碍科普知识的宣传、推送等。随着大数据技术的成熟,利用大数据对不同用户的群体进行分析,获取不同类型的用户对不同科普内容的喜好程度,为科普知识精准推送提供可能,所以,亟需一种基于大数据的科普知识精准推送方法及系统。

技术实现思路

[0003]本专利技术的目的在于克服现有技术的不足,本专利技术提供了一种基于大数据的科普知识精准推送方法及系统,能根据用户的类型精准匹配用户喜欢阅读的科普内容,并实现精准推送。
[0004]本专利技术的目的是通过以下技术方案来实现的:提供一种基于大数据的科普知识精准推送方法,其包括以下步骤:S1:建立科普大数据库,科普大数据库包括请求匹配模块和推送匹配模块;S2:推送匹配模块获取用户端历史浏览的科普内容和用户的个人信息,将用户一天内不同时段浏览的科普内容进行分类,根据分类结果,建立不同时间段内浏览的科普内容与个人信息的关系模型;S3:请求匹配模块获取新用户输入的个人信息,并提取新用户的账号信息,将个人信息作为请求标签,请求标签与关系模型进行匹配,提取匹配出的与请求标签对应的科普内容;S4:验证匹配的科普内容与新用户的匹配度,根据匹配度情况为新用户的账号精准推送不同的科普内容。
[0005]进一步地,步骤S2包括:S21:推送匹配模块获取用户端历史浏览的科普内容和用户的个人信息;将科普内容分类成历史类、人文类、军事类、社会类和环境类,定义不同种类的科普内容的运算符分别为;用户个人信息包括年龄阶段、性别和学历,其中,年龄阶段包括少儿、青少年、青年、中年和老年,性别包括男性和女性,学历包括高中、专科、本科、研究生和博士;定义关于年龄阶段的运算符为、关于性别的运算符为、关于学历的运算
符为;S22:将一天时间除去8小时的睡眠时间,剩余时间依次平均拆分成上午时段t1、中午时段t2、下午时段t3和夜间时段t4,睡眠时间为晚上的22点到第二天的6点;S23:以四个时段为标准,分别统计四个时段内读取不同种类的科普内容的概率,其中,,i为科普内容的种类,T为时段,,为阅读第i种科普内容的人数,R为不同时段内阅读科普内容的总人数;S24:筛选出不同时段内概率的最大值,并计算概率最大值对应的科普内容种类i阅读人群中占不同年龄阶段的概率e
u
、不同性别的概率f
v
和不同学历的概率g
w
:;其中,b
u
为不同年龄阶段阅读第i种科普内容的人数,u为不同年龄阶段,c
v
为不同性别阅读第i种科普内容的人数,v为不同性别,d
w
为不同性别阅读第i种科普内容的人数,w为不同学历;S25:筛选出不同年龄阶段阅读第i种科普内容的概率的最大值e
max
,并获取概率的最大值e
max
对应的年龄阶段u;筛选出不同性别阅读第i种科普内容的概率的最大值f
max
,并获取概率的最大值f
max
对应的性别v;筛选出不同学历阅读第i种科普内容的概率的最大值g
max
,并获取概率的最大值g
max
对应的学历w;S26:建立不同时段T概率最大值对应的科普内容种类i与概率最大值e
max
、概率最大值f
max
、概率最大值g
max
的关系模型:;
其中,为关系函数。
[0006]进一步地,步骤S3包括:S31:请求匹配模块获取新用户输入的个人信息,包括年龄阶段、性别和学历,并提取新用户请求阅读科普内容的时段T,将时段T,新用户的年龄阶段u、性别v和学历w一起作为请求标签;S32:将请求标签输入关系模型中,新用户对应的时段、年龄阶段u、性别v和学历w作为变量,输出一天内四个时段t1、t2、t3和t4与其匹配的科普内容i1、i2、i3和i4。
[0007]进一步地,步骤S4包括:S41:设置新用户的匹配度的验证天数h,在验证天数的每天内,将匹配的对应时段的科普内容发送到新用户的账号内,统计验证天数h内新用户每天阅读对应科普内容的时间、、和;S42:计算在验证天数内新用户每天阅读不同科普内容i1、i2、i3和i4的时间的平均值:;S43:将平均值、、和从大至小依次进行排序,将平均值中的最大值对应的科普内容作为与新用户匹配度最优的科普内容,将平均值中的最小值对应的科普内容作为与新用户匹配度最差的科普内容;S44:验证天数结束后,新用户请求阅读科普内容时,根据平均值、、和从大至小的排序,优先向新用户推送最优匹配度的科普内容,最后推送最差匹配度的科普内容。
[0008]提供一种基于大数据的科普知识精准推送系统,用于执行上述基于大数据的科普知识精准推送方法,其包括科普大数据库,科普大数据库包括登录模块、请求匹配模块、推送匹配模块和推送模块;登录模块用于登录用户的账号信息;推送匹配模块用于获取用户端历史浏览的科普内容和用户个人信息,将用户一天内不同时段浏览的科普内容进行分类,根据分类结果,建立不同时间段内浏览的科普内容
与个人信息的关系模型;请求匹配模块用于提取新用户输入的个人信息,并提取新用户的账号信息,将个人信息作为请求标签,将请求标签与关系模型进行匹配,并提取匹配出与请求标签对应的科普内容;推送模块将匹配出的科普内容通过短信、网站链接或邮件的方式发送到新用户的账号内。
[0009]本专利技术的有益效果为:本专利技术利用大数据库积累的历史用户阅读不同科普内容的信息,建立出不同类型客户阅读不同科普内容的关系,使不同科普内容与客户类型的喜好程度紧密联系起来,通过建立的关系模型,只需要新用户的性别、学历和年龄阶段就能匹配出用户喜欢阅读的科普内容,并且设立匹配度验证时间,确保用户最喜欢的科普内容最先推送给用户,无需用户自己去获取喜欢的科普内容,有效提升用户的体验感,并实现精准化的推送,更能留住客户群体,推送的科普内容更具有时效性,更符合用户的阅读意愿和兴趣。
附图说明
[0010]图1为基于大数据的科普知识精准推送方法的流程图。
具体实施方式
[0011]下面对本专利技术的具体实施方式进行描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思的专利技术创造均在保护之列。
[0012]如图1所示,本方案的基于大数据的科普知识精准推送方法包括以下步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的科普知识精准推送方法,其特征在于,包括以下步骤:S1:建立科普大数据库,科普大数据库包括请求匹配模块和推送匹配模块;S2:推送匹配模块获取用户端历史浏览的科普内容和用户的个人信息,将用户一天内不同时段浏览的科普内容进行分类,根据分类结果,建立不同时间段内浏览的科普内容与个人信息的关系模型;S3:请求匹配模块获取新用户输入的个人信息,并提取新用户的账号信息,将个人信息作为请求标签,请求标签与关系模型进行匹配,提取匹配出的与请求标签对应的科普内容;S4:验证匹配的科普内容与新用户的匹配度,根据匹配度情况为新用户的账号精准推送不同的科普内容。2.根据权利要求1所述的基于大数据的科普知识精准推送方法,其特征在于,所述步骤S2包括:S21:推送匹配模块获取用户端历史浏览的科普内容和用户的个人信息;将科普内容分类成历史类、人文类、军事类、社会类和环境类,定义不同种类的科普内容的运算符分别为;用户个人信息包括年龄阶段、性别和学历,其中,年龄阶段包括少儿、青少年、青年、中年和老年,性别包括男性和女性,学历包括高中、专科、本科、研究生和博士;定义关于年龄阶段的运算符为、关于性别的运算符为、关于学历的运算符为;S22:将一天时间除去8小时的睡眠时间,剩余时间依次平均拆分成上午时段t1、中午时段t2、下午时段t3和夜间时段t4,睡眠时间为晚上的22点到第二天的6点;S23:以四个时段为标准,分别统计四个时段内读取不同种类的科普内容的概率,其中,,i为科普内容的种类,T为时段,,为阅读第i种科普内容的人数,R为不同时段内阅读科普内容的总人数;S24:筛选出不同时段内概率的最大值,并计算概率最大值对应的科普内容种类i阅读人群中占不同年龄阶段的概率e
u
、不同性别的概率f
v
和不同学历的概率g
w

;其中,b
u
为不同年龄阶段阅读第i种科普内容的人数,u为不同年龄阶段,c
v
为不同性别阅读第i种科普内容的人数,v为不同性别,d
w
为不同性别阅读第i种科普内容的人数,w为不同学历;S25:筛选出不同年龄阶段阅读第i种科普内容的概率的最大值e
max
,并获取概率的最大值e
max
对应的年龄阶段u;筛选出不同性别阅读第i种科普内容的概率的最大值f
max
,并获取概率的最大值f
max
对应的性别v;筛...

【专利技术属性】
技术研发人员:宁方刚薛红玉刘菲菲任冠中李振罡
申请(专利权)人:中科数创北京数字传媒有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1