一种基于文本的新闻重要性评估方法、装置及电子设备制造方法及图纸

技术编号:26531451 阅读:30 留言:0更新日期:2020-12-01 14:12
本发明专利技术涉及一种基于文本的新闻重要性评估方法、装置及电子设备,所述方法,包括:读取文本新闻;对所述文本新闻进行预处理得到原始数据;对所述原始数据进行特征值提取,所述特征值包括元数据、关键词、概率模型特征值;根据各个所述特征值对应的权重配比得到各个所述特征值的分数;所述装置,包括:文本新闻读取模块、文本新闻预处理模块、特征值提取模块、特征值权重确定模块、文本新闻重要性评估模块。所述电子设备,包括:存储器、处理器,存储器中存储有可在所述处理器上运行的计算机程序,处理器执行所述计算机程序时实现前述基于文本的新闻重要性评估方法。本发明专利技术极大提高了新闻重要性评估的效率和精度,实现了对文本新闻的实时动态评估。

【技术实现步骤摘要】
一种基于文本的新闻重要性评估方法、装置及电子设备
本专利技术涉及新闻价值评估
,特别是涉及一种基于文本的新闻重要性评估方法、装置及电子设备。
技术介绍
随着网络技术的发展和新媒体的广泛应用,各类新闻的产生和发布数量大大增加,如何“砂里淘金”,选择价值更高的新闻显得尤为重要。现有的新闻价值评估技术更多关注泛领域的新闻,根据用户关注度的变化计算出不同新闻价值特征项对预测新闻价值的影响,从而完成重要性新闻价值特征项的测算。传统新闻价值评估方法更多体现的是普适性的重要性评测,且对新闻来源与社交媒体上的用户进行无差别的评估,不仅不能直接用于单一领域类新闻文本重要性的预测和评估,同时还严重制约了各行业数据、政策信息的有效传播。因此,如何更加精准、高效地对单一领域新闻文本进行重要性评估,成为了新闻价值评估
亟待解决的重要问题。
技术实现思路
为了克服上述技术问题,本专利技术提供了一种基于文本的新闻重要性评估方法、装置及电子设备,极大提高了对单一领域类新闻文本重要性进行预测评估的效率和精度。<br>为实现上述目的本文档来自技高网...

【技术保护点】
1.一种基于文本的新闻重要性评估方法,其特征在于,所述方法包括:/n读取文本新闻;/n对所述文本新闻进行预处理得到原始数据;/n对所述原始数据进行特征值提取,所述特征值包括元数据、关键词、概率模型特征值;/n根据各个所述特征值对应的权重配比得到各个所述特征值的分数;/n根据各个所述特征值的分数评估所述文本新闻的重要性。/n

【技术特征摘要】
1.一种基于文本的新闻重要性评估方法,其特征在于,所述方法包括:
读取文本新闻;
对所述文本新闻进行预处理得到原始数据;
对所述原始数据进行特征值提取,所述特征值包括元数据、关键词、概率模型特征值;
根据各个所述特征值对应的权重配比得到各个所述特征值的分数;
根据各个所述特征值的分数评估所述文本新闻的重要性。


2.根据权利要求1所述的一种基于文本的新闻重要性评估方法,其特征在于,所述文本新闻包括txt或pdf格式的新闻文本。


3.根据权利要求1所述的一种基于文本的新闻重要性评估方法,其特征在于,所述预处理包括但不限于将字符序列转换为小写字符、选用长度在一定范围之间的单词、删除非法字符、删除数字、删除停用词、词干提取和词性还原。


4.根据权利要求3所述的一种基于文本的新闻重要性评估方法,其特征在于,根据所述特征值类型的不同要选用不同的预处理方式:
当所述特征值类型为元数据时,选用所述删除非法字符和/或所述删除停用词方式对所述文本新闻进行预处理;
当所述特征值类型为关键词时,选用所述删除非法字符和/或所述删除停用词和/或删除数字方式对所述文本新闻进行预处理;
当所述特征值类型为概率模型特征值时,选用所述删除非法字符和/或所述删除停用词和/或删除数字和/或词干提取和词性还原方式对所述文本新闻进行预处理。


5.根据权利要求1所述的一种基于文本的新闻重要性评估方法,其特征在于,对所述关键词的提取,包括如下步骤:
S1:构建多元词典:
筛选金融行业关键词组成静态词典;
通过自然语言处理和神经网络训练动态获取训练集关键词组成动态词典;
所述训练集关键词与所述金融行业关键词互不重叠;
将所述静态词典与所述动态词典合并组成多元词典;
S2:命名实体识别:
通过自然语言处理和神经网络训练获得用于评估的命名实体;
利用神经网络模型识别所述命名实体作为关键词;
S3:关键词排序
将步骤S1中所述多元词典中的所述关键词和步骤S2中识别所述命名实体得到的所述关键词通过热度搜索提取热度值,并按照所述热度值进行排序。


6.根据权利要求5所述的一种基于文本的新闻重要性评估方法,其特征在于,所述训练集关键词的获取是动态的,通过训练增加训练集中未出现过的目标词汇作为关键词,所述训练集关键词会实时通过热度搜索被排序,再用于评...

【专利技术属性】
技术研发人员:张庆全陈和陆文茜
申请(专利权)人:上海智芝全智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1