【技术实现步骤摘要】
一种基于大数据处理的新闻传播方法及系统
本专利技术属于新闻传播
,尤其涉及一种基于大数据处理的新闻传播方法及系统。
技术介绍
目前,新闻种类越来越多,每天的新闻新增量非常庞大,用户无话在有限的时间内浏览所有新闻,如何将用户关注的新闻推送给用户,是当今研究的一个重点。现有技术采用的方式是将新闻按种类进行分类,根据用户喜欢的种类进行新闻推送。但是,新闻种类有限,同种类新闻数量大,如果按新闻种类进行新闻推送,被推送新闻正好是用户喜欢的新闻概率较低;往往需要推送10篇以上新闻,甚至推送上百篇新闻后,才会出现一篇用户想要的新闻,新闻推送效率低;同时无法对新闻的传播力进行预测,降低了传播速度。综上所述,现有技术存在的问题及缺陷是:(1)现有新闻传播方法新闻推送效率低,被推送新闻正好是用户喜欢的新闻概率较低。(2)现有新闻传播方法无法对新闻的传播力进行预测,降低了传播速度。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于大数据处理的新闻传播方法及系统。本专利技术是这 ...
【技术保护点】
1.一种基于大数据处理的新闻传播方法,其特征在于,所述基于大数据处理的新闻传播方法包括:/n步骤一,数据获取模块通过数据获取程序获取搜索的新闻关键字、用户新闻偏好数据;用户新闻偏好数据包括用户ID和用户偏好关键词;数据分析模块对获取的需要新闻关键字和待推送用户新闻偏好数据的关联度进行权重分析;/n所述权重分析的方法包括:/n步骤A,获取新闻关键词和用户新闻偏好数据之间的关系系数;/n步骤B,基于用户新闻偏好数据和关键词的关系系数,向用户推送新闻集;/n步骤C,中央处理器获取用户反馈信息,所述反馈信息包括新闻集中的各新闻是否被浏览的信息;/n步骤D,基于用户的反馈信息,调整用 ...
【技术特征摘要】
1.一种基于大数据处理的新闻传播方法,其特征在于,所述基于大数据处理的新闻传播方法包括:
步骤一,数据获取模块通过数据获取程序获取搜索的新闻关键字、用户新闻偏好数据;用户新闻偏好数据包括用户ID和用户偏好关键词;数据分析模块对获取的需要新闻关键字和待推送用户新闻偏好数据的关联度进行权重分析;
所述权重分析的方法包括:
步骤A,获取新闻关键词和用户新闻偏好数据之间的关系系数;
步骤B,基于用户新闻偏好数据和关键词的关系系数,向用户推送新闻集;
步骤C,中央处理器获取用户反馈信息,所述反馈信息包括新闻集中的各新闻是否被浏览的信息;
步骤D,基于用户的反馈信息,调整用户新闻偏好数据和关键词的关系系数;
步骤二,根据数据分析结果,中央控制模块通过信号传输模块与云端连接,提取相应的新闻信息;中央控制模块控制传播量计算模块对新闻传播量进行计算;
所述传播量计算模块对新闻传播量进行计算时:
首先获取新闻的发布日期以及新闻发布日期与新闻传播量统计日的时间间隔;
然后获取新闻发布日期至新闻传播量统计日的阅读数,以及新闻发布日期至新闻传播量统计日的评论数;
最后获取新闻发布日期至新闻传播量统计日的参与人数;
步骤三,根据新闻传播量,中央控制模块控制新闻传播评价模块对新闻传播进行评价,并且传播力预测模块对新闻传播力进行预测;
步骤四,根据新闻传播力预测结果数据,新闻传播模块接受与搜索的新闻关键字和用户新闻偏好数据新闻;
步骤五,数据存储模块存储获取的需要新闻的关键字、数据分析结果、传播力预测数据、新闻传播量以及新闻传播评价数据;显示模块显示获取的需要新闻的关键字、数据分析结果、传播力预测数据、新闻传播量以及新闻传播评价的实时数据。
2.如权利要求1所述的基于大数据处理的新闻传播方法,其特征在于,所述步骤一中,数据获取模块提取出需要新闻的主题和关键词的方法包括:
获取对需要新闻,并通过停用词表将新闻稿中的停用词进行过滤;通过关键词提取算法对新闻稿中的关键词进行提取;
根据新闻稿中提取的关键词使用LDA主题模型得到新闻稿的主题。
3.如权利要求1所述的基于大数据处理的新闻传播方法,其特征在于,所述传播量计算模块用于计算新闻发布日期至新闻传播量统计日的传播量,将新闻发布日期获取单元、时间间隔获取单元、阅读数获取单元、评论数获取单元和参与人数获取单元所获取的参数数据引入时间衰减函数单元后得出新闻的传播量。
4.如权利要求1所述的基于大数据处理的新闻传播方法,其特征在于,所述需要新闻关键词和待推送用户新闻偏好数据之间的关系系数的计算方法,具体包括:
其中,Nij表示第i个关键词相对于第j个关键词的关系系数;i=j时,第i个关键词相对于第j个关键词的关系系数为1;i≠j时,第i个关键词相对于第j个关键词的关系系数为其中,Yij表示第i个关键词相对于第j个关键词的关系值,n为关键词总数量,Yij初始值为1。
5.如权利要求1所述的基于大数据处理的新闻传播方法,其特征在于,所述步骤二中,根据数据分析结果,中央控制模块通过信号传输模块与云端连接,提取相应的新闻信息过程为:
提取新闻关键词和用户新闻偏好数据中的特征信息,将与特征信息相关的数据建立成数据训练集;
将特征信息与数据训练集中的数据进行相似度计算,按照相似度增大的趋势进行排序;
确定中间值,提取离中间值相近的N个点;计算N个点所在类别的数据训练集出现的频率;
确定出现频率最高的点作为相应新闻信息。
6.如权利要求1所述的基于大数据处理的新闻传播方法,其特征在于,所述步骤三中,传播力预测模块通过传播力预测程序对新闻传播力进行预测的方法包括:
步骤a,通过对相应的新闻进行拆解,提取出需要新闻的主题和关键词;
步骤b,通过浏览器找到用户浏览内容的主题与对需要新闻的主题一致的主题,提取用户浏览内容的关...
【专利技术属性】
技术研发人员:杨国为,杨章静,詹天明,张凡龙,黄璞,万鸣华,
申请(专利权)人:南京审计大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。