一种资讯信息的处理方法、装置及设备制造方法及图纸

技术编号:36392120 阅读:12 留言:0更新日期:2023-01-18 09:56
本发明专利技术实施例公开了一种资讯信息的处理方法、装置及设备,处理方法包括:对待处理资讯信息进行预处理,得到目标资讯信息;利用第一预设维度,基于第一标签配置模型,对目标资讯信息进行一次标签配置,得到一次打标结果;利用第二预设维度,将一次打标结果输入第二标签配置模型,对目标资讯信息进行二次标签配置,得到二次打标结果;基于一次打标结果以及二次打标结果中的标签,确定待处理资讯信息的最终标签。本申请通过从多维度对资讯信息进行两次打标,并使用一次打标结果作为其他维度的输入进行二次打标,实现了提升资讯信息的分类精确度,且增加了资讯信息的打标适用场景的技术效果。果。果。

【技术实现步骤摘要】
一种资讯信息的处理方法、装置及设备


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种资讯信息的处理方法、装置及设备。

技术介绍

[0002]大数据时代,资讯的海洋呼啸而来,人们的阅读习惯也逐步转变为快节奏,更加热衷于能够直观获取信息的短资讯、图表和视频。对于一些内容丰富、文本较长的资讯来说,如研究报告等,即使包含更多的知识研判信息和图表总结,也难免被读者所忽略,因此需要对资讯信息进行标签化处理,方便读者阅读。
[0003]现有的文本标签化方法大多是为应对特定应用场景而进行的单一维度的打标,无法适用于更多的场景需求,影响资讯信息的分类效果。

技术实现思路

[0004]本专利技术实施例提供一种资讯信息的处理方法、装置及设备,解决了现有技术中对资讯信息进行标签化处理时,仅从单一维度进行打标所存在的无法适用多种资讯信息场景,且影响了资讯信息的分类效果的技术问题。
[0005]第一方面,本专利技术实施例提供了一种资讯信息的处理方法,所述处理方法包括:
[0006]对待处理资讯信息进行预处理,得到目标资讯信息,其中,所述待处理资讯信息的信息长度大于预设信息长度;
[0007]利用第一预设维度,基于第一标签配置模型,对所述目标资讯信息进行一次标签配置,得到一次打标结果,其中,所述第一标签配置模型包括预设关键词匹配算法或预设资讯分类规则;
[0008]利用第二预设维度,将所述一次打标结果输入第二标签配置模型,对所述目标资讯信息进行二次标签配置,得到二次打标结果,其中,所述第二标签配置模型为机器学习模型,所述第一预设维度与所述第二预设维度不同;
[0009]基于所述一次打标结果以及所述二次打标结果中的标签,确定所述待处理资讯信息的最终标签。
[0010]第二方面,本专利技术实施例还提供了一种资讯信息的处理装置,所述处理装置包括:
[0011]预处理单元,用于对待处理资讯信息进行预处理,得到目标资讯信息,其中,所述待处理资讯信息的信息长度大于预设信息长度;
[0012]第一标签配置单元,用于利用第一预设维度,基于第一标签配置模型,对所述目标资讯信息进行一次标签配置,得到一次打标结果,其中,所述第一标签配置模型包括预设关键词匹配算法或预设资讯分类规则;
[0013]第二标签配置单元,用于利用第二预设维度,将所述一次打标结果输入第二标签配置模型,对所述目标资讯信息进行二次标签配置,得到二次打标结果,其中,所述第二标签配置模型为机器学习模型,所述第一预设维度与所述第二预设维度不同;
[0014]标签确定单元,用于基于所述一次打标结果以及所述二次打标结果中的标签,确定所述待处理资讯信息的最终标签。
[0015]第三方面,本专利技术实施例还提供了一种资讯信息的处理设备,所述资讯信息的处理设备包括:
[0016]一个或多个处理器;
[0017]存储装置,用于存储一个或多个程序;
[0018]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例第一方面任意的资讯信息的处理方法。
[0019]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例第一方面任意的资讯信息的处理方法。
[0020]第五方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本专利技术实施例第一方面任意的资讯信息的处理方法。
[0021]本专利技术实施例公开了一种资讯信息的处理方法、装置及设备,处理方法包括:对待处理资讯信息进行预处理,得到目标资讯信息;利用第一预设维度,基于第一标签配置模型,对目标资讯信息进行一次标签配置,得到一次打标结果;利用第二预设维度,将一次打标结果输入第二标签配置模型,对目标资讯信息进行二次标签配置,得到二次打标结果;基于一次打标结果以及二次打标结果中的标签,确定待处理资讯信息的最终标签。本申请通过从多维度对资讯信息进行两次打标,并使用一次打标结果作为其他维度的输入进行二次打标,解决了现有技术中对资讯信息进行标签化处理时,仅从单一维度进行打标所存在的无法适用多种资讯信息场景,且影响了资讯信息的分类效果的技术问题,实现了提升资讯信息的分类精确度,且增加了资讯信息的打标适用场景的技术效果。
附图说明
[0022]图1是本专利技术实施例提供的一种资讯信息的处理方法的流程图;
[0023]图2是本专利技术实施例提供的另一种资讯信息的处理方法的流程图;
[0024]图3是本专利技术实施例提供的又一种资讯信息的处理方法的流程图;
[0025]图4是本专利技术实施例提供的又一种资讯信息的处理方法的流程图;
[0026]图5是本专利技术实施例提供的一种资讯信息的处理装置的结构图;
[0027]图6为本专利技术实施例提供的一种资讯信息的处理设备的结构示意图。
具体实施方式
[0028]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0029]需要说明的是,本专利技术的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于限定特定顺序。本专利技术下述各个实施例可以单独执行,各个实施例之间也可以相互结合执行,本专利技术实施例对此不作具体限制。
[0030]图1是本专利技术实施例提供的一种资讯信息的处理方法的流程图。该资讯信息的处理方法可适用于所有需要进行资讯信息处理的业务场景,例如对研究报告等内容丰富且较
长的资讯进行标签化处理的场景。该资讯信息的处理方法可以由资讯信息的处理装置来执行,该装置可以采用硬件和/或软件的方式来实现,并一般可集成于服务器中。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
[0031]如图1所示,该资讯信息的处理方法具体包括如下步骤:
[0032]S101,对待处理资讯信息进行预处理,得到目标资讯信息,其中,待处理资讯信息的信息长度大于预设信息长度。
[0033]具体地,待处理资讯信息可以为由多个章节、图表等构成的文章、研究报告、新闻长资讯等,通常情况下,这类资讯的信息长度大于预设信息长度,其中,预设信息长度可以根据需要进行标签化处理的实际场景进行设置。在对待处理资讯信息进行标签化处理之前,还需要对待处理资讯信息进行预处理,例如对待处理资讯信息的内容进行拆解,并对拆解后的内容进行数据清洗等,得到目标资讯信息。
[0034]S102,利用第一预设维度,基于第一标签配置模型,对目标资讯信息进行一次标签配置,得到一次打标结果,其中,第一标签配置模型包括预设关键词匹配算法或预设资讯分类规则。
[0035]具体地,在得到目标资讯信息之后,利用预先设置的第一预设维度使用第一标签配置模型对目标资讯信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种资讯信息的处理方法,其特征在于,所述处理方法包括:对待处理资讯信息进行预处理,得到目标资讯信息,其中,所述待处理资讯信息的信息长度大于预设信息长度;利用第一预设维度,基于第一标签配置模型,对所述目标资讯信息进行一次标签配置,得到一次打标结果,其中,所述第一标签配置模型包括预设关键词匹配算法或预设资讯分类规则;利用第二预设维度,将所述一次打标结果输入第二标签配置模型,对所述目标资讯信息进行二次标签配置,得到二次打标结果,其中,所述第二标签配置模型为机器学习模型,所述第一预设维度与所述第二预设维度不同;基于所述一次打标结果以及所述二次打标结果中的标签,确定所述待处理资讯信息的最终标签。2.根据权利要求1所述的资讯信息的处理方法,其特征在于:所述第一预设维度包括下述至少一项:区域维度、行业维度、主体维度以及热词维度,其中,所述热词维度的标签依据所述预设关键词匹配算法确定得到,所述区域维度、所述行业维度以及所述主体维度的标签依据所述预设资讯分类规则确定得到;所述第二预设维度包括下述至少一项:文本主题以及文本情感基调。3.根据权利要求1所述的资讯信息的处理方法,其特征在于,对待处理资讯信息进行预处理,得到目标资讯信息包括:将所述待处理资讯信息,拆解为多个章节信息以及图表信息,作为所述目标资讯信息。4.根据权利要求3所述的资讯信息的处理方法,其特征在于,将所述待处理资讯信息,拆解为多个章节信息以及图表信息,作为所述目标资讯信息包括:将所述待处理资讯信息拆解为多个章节信息以及图表信息;基于文字识别技术对所述图表信息的内容进行识别,得到图表文本内容;对所述章节信息以及所述图表文本内容进行数据清洗,得到所述目标资讯信息。5.根据权利要求1所述的资讯信息的处理方法,其特征在于,所述第二标签配置模型为Albert模型,所述第二标签配置模型的训练过程包括:获取预设数量的所述待处理资讯信息,将所述待处理资讯信息进行预处理,并将预处理后得到所述目标资讯信息作为训练样本;将所述训练样本输入Albert模型进行训练,得到所述第二标签配置模型。6.根据权利要求4所述的资讯信息的处理方法,其特征在于,基于所述一次打标结果以及所述二次打标结果中的标签,确...

【专利技术属性】
技术研发人员:许锐高扬黄炜周骏方宇洁甘竹红
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1