新闻传播力预测方法技术

技术编号:14854454 阅读:81 留言:0更新日期:2017-03-18 21:50
一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF‑IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD‑IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。本发明专利技术中提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性。

【技术实现步骤摘要】

本专利技术涉及数据检索领域,具体涉及一种新闻传播力预测方法
技术介绍
随着互联网新闻爆炸式传播,坚持正确方向和创新方法手段提高新闻舆论传播力引导力尤为重要。如何预测新闻舆论传播力?首先我们要知道什么是传播力。传播力指的是互联网特征新闻所具有的分值总和。通过在短时间内资讯传播力达到一个阈值,就可以预测此新闻事件将会是一个热点事件。
技术实现思路
本专利技术的目的是针对现有的技术存在的不足,提出了一种工作效率高的新闻传播力预测方法。本专利技术所解决的技术问题采用以下技术方案来实现一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD-IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。本专利技术的有益效果为:提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性;通过神经网络计算,得出传播力分值,满足阈值,即可预测该新闻为热点事件。附图说明图1是本专利技术的新闻传播力预测方法的流程图。具体实施方式参照附图,一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD-IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。本专利技术提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性;通过神经网络计算,得出传播力分值,满足阈值,即可预测该新闻为热点事件。所属领域的普通技术人员应当理解:以上,所述仅为本专利技术的具体实施例而已,并不用于限制本专利技术,凡在本专利技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
新闻传播力预测方法

【技术保护点】
一种新闻传播力预测方法,其特征在于:包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF‑IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD‑IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。

【技术特征摘要】
1.一种新闻传播力预测方法,其特征在于:包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-...

【专利技术属性】
技术研发人员:张勇
申请(专利权)人:天津海量信息技术股份有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1