一种财经新闻早报的自动推荐方法及系统技术方案

技术编号:34742787 阅读:11 留言:0更新日期:2022-08-31 18:35
本发明专利技术提供的一种财经新闻早报的自动推荐方法包括:步骤S1:采集新闻数据;步骤S2:对所述新闻数据进行标注;步骤S3:训练模型,基于Fasttext训练财经新闻分类模型Model1,基于TextCNN训练新闻重要性评估模型Model2;步骤S4:模型评估;步骤S5:对所述同花顺每日财经新闻数据表T2中每个新闻数据使用所述财经新闻分类模型Model1计算类别标签,使用所述新闻重要性评估模型Model2评估重要性;步骤S6:通过控制各个分类配置config文件,按照每个类别下分数最高的对应个数新闻采集汇编成当日财经新闻早报推送给用户。通过fasttext分类算法和各大网站头条匹配自动化地对新闻质量进行评估,并利用TextCNN分类算法对财经新闻打上新闻类别标签,结合干预模块自动化生成财经新闻早报。早报。早报。

【技术实现步骤摘要】
一种财经新闻早报的自动推荐方法及系统


[0001]本专利技术涉及财经早报领域,尤其涉及一种财经新闻早报的自动推荐方法及系统。

技术介绍

[0002]财经早报是将近期财经相关资讯汇总优选并呈现给用户的一种内容形式。其主要作用有以下几点:帮助广大用户过滤掉低价值讯息,找到近期最重要的资讯并为用户理财资讯提供一些参考;提升用户使用APP的粘性,找到用户感兴趣的地方形成用户画像,理财经理有了用户这类用户画像以后,方便他更好的针对用户推销理财产品。
[0003]现有技术方案主要是财经资讯类APP通过财经编辑,实时根据当前事件,根据相关领域经验将事件采编为新闻并汇总发布。
[0004]需要资深财经编辑去编辑润色文章,并到点发布;需要人工对新闻质量及重要性进行评估筛选;需要人工对新闻类别进行分类,划定其类别标签。

技术实现思路

[0005]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种财经新闻早报的自动推荐方法及系统。
[0006]根据本专利技术的一个方面,提供了一种财经新闻早报的自动推荐方法包括:
[0007]步骤S1:采集新闻数据;
[0008]步骤S2:对所述新闻数据进行标注;
[0009]步骤S3:训练模型,基于Fasttext训练财经新闻分类模型Model1,基于TextCNN训练新闻重要性评估模型Model2;
[0010]步骤S4:模型评估,使用AUC指标对所述财经新闻分类模型Model1和所述新闻重要性评估模型Model2效果进行评估;
[0011]步骤S5:对所述同花顺每日财经新闻数据表T2中每个新闻数据使用所述财经新闻分类模型Model1计算类别标签,使用所述新闻重要性评估模型Model2评估重要性;
[0012]步骤S6:通过控制各个分类配置config文件,按照每个类别下分数最高的对应个数新闻采集汇编成当日财经新闻早报推送给用户。
[0013]可选的,所述财经新闻类别包括:宏观经济类、保险类、地产类、外汇类、股市类和全球要闻类。
[0014]可选的,所述采集新闻数据具体包括:
[0015]通过ETL作业以及爬虫程序定期收集基础数据表;具体为:历史财经新闻数据表T1,同花顺每日财经新闻数据表T2共2张表的数据信息。
[0016]可选的,所述对所述新闻数据进行标注具体包括:
[0017]标注所述历史财经新闻数据表T1中每条新闻所属财经新闻类别,并通过业务专家评估每条所述新闻是否重要,如果重要,标注1,否则,标注0。
[0018]可选的,所述基于Fasttext训练财经新闻分类模型Model1,基于TextCNN训练新闻
重要性评估模型Model2具体包括:
[0019]基于Fasttext训练财经新闻分类模型Model1具体为:用FastText和char

CNN、deepCNN主流的深度学习框架;
[0020]基于TextCNN训练新闻重要性评估模型Model2具体为:用于计算机视觉方向的工作,YoonKim针对CNN的输入层做了变形,提出了文本分类模型textCNN。
[0021]可选的,所述模型评估具体包括:
[0022]收集每日新闻数据集,使用训练好的所述新闻类别分类模型Model1和所述新闻重要性评估模型Model2分别计算得到对应的新闻类别标签和新闻重要性评分。
[0023]本专利技术还提供了一种财经新闻早报的自动推荐系统,所述推荐系统包括:
[0024]数据采集模块,用于采集新闻数据;
[0025]数据标注模块,用于对所述新闻数据进行标注;
[0026]模型训练模块,用于训练模型,基于Fasttext训练财经新闻分类模型Model1,基于TextCNN训练新闻重要性评估模型Model2;
[0027]模型评估模块,用于进行模型评估,使用AUC指标对所述财经新闻分类模型Model1和所述新闻重要性评估模型Model2效果进行评估;
[0028]类别标签计算模块,用于对所述同花顺每日财经新闻数据表T2中每个新闻数据使用所述财经新闻分类模型Model1计算类别标签,使用所述新闻重要性评估模型Model2评估重要性;
[0029]早报推送模块,用于通过控制各个分类配置config文件,按照每个类别下分数最高的对应个数新闻采集汇编成当日财经新闻早报推送给用户。
[0030]本专利技术提供的一种财经新闻早报的自动推荐方法包括:步骤S1:采集新闻数据;步骤S2:对所述新闻数据进行标注;步骤S3:训练模型,基于Fasttext训练财经新闻分类模型Model1,基于TextCNN训练新闻重要性评估模型Model2;步骤S4:模型评估,使用AUC指标对所述财经新闻分类模型Model1和所述新闻重要性评估模型Model2效果进行评估;步骤S5:对所述同花顺每日财经新闻数据表T2中每个新闻数据使用所述财经新闻分类模型Model1计算类别标签,使用所述新闻重要性评估模型Model2评估重要性;步骤S6:通过控制各个分类配置config文件,按照每个类别下分数最高的对应个数新闻采集汇编成当日财经新闻早报推送给用户。通过fasttext分类算法和各大网站头条匹配自动化地对新闻质量进行评估,并利用TextCNN分类算法对财经新闻打上新闻类别标签,结合干预模块自动化生成财经新闻早报。
[0031]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0032]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0033]图1为本专利技术实施例提供的一种财经新闻早报的自动推荐方法的流程图。
具体实施方式
[0034]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0035]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0036]下面结合附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0037]如图1所示,一种财经新闻早报的自动推荐方法,具体包括:
[0038]步骤S101:采集新闻数据,通过ETL作业以及爬虫程序定期收集基础数据表;历史财经新闻数据表T1,同花顺每日财经新闻数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种财经新闻早报的自动推荐方法,其特征在于,所述自动推荐方法包括:步骤S1:采集新闻数据;步骤S2:对所述新闻数据进行标注;步骤S3:训练模型,基于Fasttext训练财经新闻分类模型Model1,基于TextCNN训练新闻重要性评估模型Model2;步骤S4:模型评估,使用AUC指标对所述财经新闻分类模型Model1和所述新闻重要性评估模型Model2效果进行评估;步骤S5:对所述同花顺每日财经新闻数据表T2中每个新闻数据使用所述财经新闻分类模型Model1计算类别标签,使用所述新闻重要性评估模型Model2评估重要性;步骤S6:通过控制各个分类配置config文件,按照每个类别下分数最高的对应个数新闻采集汇编成当日财经新闻早报推送给用户。2.根据权利要求1所述的一种财经新闻早报的自动推荐方法,其特征在于,所述财经新闻类别包括:宏观经济类、保险类、地产类、外汇类、股市类和全球要闻类。3.根据权利要求1所述的一种财经新闻早报的自动推荐方法,其特征在于,所述采集新闻数据具体包括:通过ETL作业以及爬虫程序定期收集基础数据表;具体为:历史财经新闻数据表T1,同花顺每日财经新闻数据表T2共2张表的数据信息。4.根据权利要求3所述的一种财经新闻早报的自动推荐方法,其特征在于,所述对所述新闻数据进行标注具体包括:标注所述历史财经新闻数据表T1中每条新闻所属财经新闻类别,并通过业务专家评估每条所述新闻是否重要,如果重要,标注1,否则,标注0。5.根据权利要求1所述的一种财经新闻早报的自动推荐方法,其特征在于,所述基于Fasttext训练财经新闻分类模型M...

【专利技术属性】
技术研发人员:孙志强
申请(专利权)人:北银金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1