一种资讯信息的处理方法、装置及设备制造方法及图纸

技术编号：36392120 阅读：12 留言：0更新日期：2023-01-18 09:56

本发明专利技术实施例公开了一种资讯信息的处理方法、装置及设备，处理方法包括：对待处理资讯信息进行预处理，得到目标资讯信息；利用第一预设维度，基于第一标签配置模型，对目标资讯信息进行一次标签配置，得到一次打标结果；利用第二预设维度，将一次打标结果输入第二标签配置模型，对目标资讯信息进行二次标签配置，得到二次打标结果；基于一次打标结果以及二次打标结果中的标签，确定待处理资讯信息的最终标签。本申请通过从多维度对资讯信息进行两次打标，并使用一次打标结果作为其他维度的输入进行二次打标，实现了提升资讯信息的分类精确度，且增加了资讯信息的打标适用场景的技术效果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
一种资讯信息的处理方法、装置及设备

[0001]本专利技术实施例涉及数据处理
，尤其涉及一种资讯信息的处理方法、装置及设备。

技术介绍

[0002]大数据时代，资讯的海洋呼啸而来，人们的阅读习惯也逐步转变为快节奏，更加热衷于能够直观获取信息的短资讯、图表和视频。对于一些内容丰富、文本较长的资讯来说，如研究报告等，即使包含更多的知识研判信息和图表总结，也难免被读者所忽略，因此需要对资讯信息进行标签化处理，方便读者阅读。
[0003]现有的文本标签化方法大多是为应对特定应用场景而进行的单一维度的打标，无法适用于更多的场景需求，影响资讯信息的分类效果。

技术实现思路

[0004]本专利技术实施例提供一种资讯信息的处理方法、装置及设备，解决了现有技术中对资讯信息进行标签化处理时，仅从单一维度进行打标所存在的无法适用多种资讯信息场景，且影响了资讯信息的分类效果的技术问题。
[0005]第一方面，本专利技术实施例提供了一种资讯信息的处理方法，所述处理方法包括：
[0006]对待处理资讯信息进行预处理，得到目标资讯信息，其中，所述待处理资讯信息的信息长度大于预设信息长度；
[0007]利用第一预设维度，基于第一标签配置模型，对所述目标资讯信息进行一次标签配置，得到一次打标结果，其中，所述第一标签配置模型包括预设关键词匹配算法或预设资讯分类规则；
[0008]利用第二预设维度，将所述一次打标结果输入第二标签配置模型，对所述目标资讯信息进行二次标签配置，得到二次打标结果，其...

【技术保护点】

【技术特征摘要】
1.一种资讯信息的处理方法，其特征在于，所述处理方法包括：对待处理资讯信息进行预处理，得到目标资讯信息，其中，所述待处理资讯信息的信息长度大于预设信息长度；利用第一预设维度，基于第一标签配置模型，对所述目标资讯信息进行一次标签配置，得到一次打标结果，其中，所述第一标签配置模型包括预设关键词匹配算法或预设资讯分类规则；利用第二预设维度，将所述一次打标结果输入第二标签配置模型，对所述目标资讯信息进行二次标签配置，得到二次打标结果，其中，所述第二标签配置模型为机器学习模型，所述第一预设维度与所述第二预设维度不同；基于所述一次打标结果以及所述二次打标结果中的标签，确定所述待处理资讯信息的最终标签。2.根据权利要求1所述的资讯信息的处理方法，其特征在于：所述第一预设维度包括下述至少一项：区域维度、行业维度、主体维度以及热词维度，其中，所述热词维度的标签依据所述预设关键词匹配算法确定得到，所述区域维度、所述行业维度以及所述主体维度的标签依据所述预设资讯分类规则确定得到；所述第二预设维度包括下述至少一项：文本主题以及文本情感基调。3.根据权利要求1所述的资讯信息的处理方法，其特征在于，对待处理资讯信息进行预处理，得到目标资讯信息包括：将所述待处理资讯信息，拆解为多个章节信息以及图表信息，作为所述目标资讯信息。4.根据权利要求3所述的资讯信息的处理方法，其特征在于，将所述待处理资讯信息，拆解为多个章节信息以及图表信息，作为所述目标资讯信息包括：将所述待处理资讯信息拆解为多个章节信息以及图表信息；基于文字识别技术对所述图表信息的内容进行识别，得到图表文本内容；对所述章节信息以及所述图表文本内容进行数据清洗，得到所述目标资讯信息。5.根据权利要求1所述的资讯信息的处理方法，其特征在于，所述第二标签配置模型为Albert模型，所述第二标签配置模型的训练过程包括：获取预设数量的所述待处理资讯信息，将所述待处理资讯信息进行预处理，并将预处理后得到所述目标资讯信息作为训练样本；将所述训练样本输入Albert模型进行训练，得到所述第二标签配置模型。6.根据权利要求4所述的资讯信息的处理方法，其特征在于，基于所述一次打标结果以及所述二次打标结果中的标签，确...

【专利技术属性】
技术研发人员：许锐，高扬，黄炜，周骏，方宇洁，甘竹红，
申请(专利权)人：上海浦东发展银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人