System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种业务数据分类分级方法及装置制造方法及图纸_技高网

一种业务数据分类分级方法及装置制造方法及图纸

技术编号:40447558 阅读:10 留言:0更新日期:2024-02-22 23:07
本申请提供了一种业务数据分类分级方法及装置,该方法结合模式识别、关键字识别和自然语言处理技术对民航业务数据进行分类和分级,该方法可以根据业务需求和数据特征自动识别和标记数据的类别和级别(即重要程度),提高含量数据分类分级的效率。从而实现有效的数据管理和分析。

【技术实现步骤摘要】

本专利技术属于计算机,尤其涉及一种业务数据分类分级方法及装置


技术介绍

1、业务系统在运行时会产生大量的业务数据,为了方便企业精细化管理信息安全,需要对其业务数据进行分类分级。

2、部分分类分级模型采用自动识别技术,如模式识别、关键字和模式识别等技术,但这些识别技术对数据的类型依赖程度非常高。以民航业务数据为例,这些自动识别技术对身份证、电话号码、银行卡等数据类型识别效果非常好,但无法识别姓名、家庭住址等数据,基于模式识别和关键字识别技术很难全面识别数据文件中的重要数据。

3、因此,亟需一种能够实现对数据更全面的识别和分类分级的方法。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种业务数据分类分级方法,以解决上述的至少部分问题,其公开的技术方案如下:

2、第一方面,本申请提供了一种业务数据分类分级方法,包括:

3、收集需要分类和分级的待处理数据;

4、若所述待处理数据是结构化数据,提取所述待处理数据的各数据字段并进行预处理;

5、将预处理后的结构化数据输入至第一数据分类分级模型,得到所述结构化数据的类别和重要级别;

6、若所述待处理数据是非结构化数据,对所述待处理数据进行分词处理;

7、将分词处理后的非结构化数据输入至第二数据分类分级模型,得到所述非结构化数据的类别及重要级别。

8、第二方面,本申请还提供了一种业务数据分类分级装置,包括:

9、第一收集模块,用于收集需要分类和分级的待处理数据;

10、第一识别模块,用于识别所述待处理数据的结构类型;

11、第一预处理模块,用于当所述待处理数据是结构化数据时,提取所述待处理数据的各数据字段并进行预处理;

12、第一分类分级模块,用于将预处理后的结构化数据输入至第一数据分类分级模型,得到所述结构化数据的类别和重要级别;

13、第二预处理模块,用于当所述待处理数据是非结构化数据时,对所述待处理数据进行分词处理;

14、第二分类分级模块,用于将分词处理后的非结构化数据输入至第二数据分类分级模型,得到非结构化数据的类别及重要级别。

15、第三方面,本申请还提供了一种计算设备,包括处理器和存储器,所述存储器内存储有可在处理器上运行的程序指令,所述处理器运行存储器内存储的该程序指令时使得所述计算设备实现第一方面所述的业务数据分类分级方法。

16、与现有技术相比,本专利技术提供的上述技术方案具有如下优点:对于结构化数据,利用基于模式识别和关键字识别技术识别各字段的属性,同时,对于结构化数据中的文本数据基于nlp技术进行识别。进一步根据数据识别结果对数据进行分类分级。对于非结构化数据,结合模式识别、关键字识别和nlp技术识别文本数据文件包含的属性特征,并根据属性特征进行数据分类分级。该方案可以自动准确地识别业务数据,提高了数据分类分级的效率。通过采用nlp技术可以识别文本数据,如姓名、住址、旅客反馈信息、投诉建议等。而且,该方案可以自动、快速地识别旅客反馈信息的重要级别,作为处理者处理该反馈信息优先级的参考,避免了处理者处理该反馈信息时全面浏览信息,大大减轻了处理反馈信息的工作量,提高了旅客反馈信息的处理效率。

本文档来自技高网...

【技术保护点】

1.一种业务数据分类分级方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将预处理后的结构化数据输入至第一数据分类分级模型,得到所述结构化数据的类别和重要级别,包括:

3.根据权利要求1所述的方法,其特征在于,若所述待处理数据是非结构化数据,对所述待处理数据进行分词处理,包括:

4.根据权利要求1所述的方法,其特征在于,所述将分词处理后的非结构化数据输入至第二数据分类分级模型,得到非结构化数据的类别及重要级别,包括:

5.根据权利要求4所述的方法,其特征在于,所述将分词得到的数据片段输入至第二数据分类分级模型进行识别,获得所述非结构化数据包含内容的属性特征,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种业务数据分类分级装置,其特征在于,包括:

9.根据权利要求8所述的装置,其特征在于,所述装置还包括:

10.一种计算设备,其特征在于,包括处理器和存储器,所述存储器内存储有可在处理器上运行的程序指令,所述处理器运行存储器内存储的该程序指令时使得所述计算设备实现权利要求1-7任一项所述的业务数据分类分级方法。

...

【技术特征摘要】

1.一种业务数据分类分级方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将预处理后的结构化数据输入至第一数据分类分级模型,得到所述结构化数据的类别和重要级别,包括:

3.根据权利要求1所述的方法,其特征在于,若所述待处理数据是非结构化数据,对所述待处理数据进行分词处理,包括:

4.根据权利要求1所述的方法,其特征在于,所述将分词处理后的非结构化数据输入至第二数据分类分级模型,得到非结构化数据的类别及重要级别,包括:

5.根据权利要求4所述的方法,其特征在于,所述将分词得到的数据片段输入至第二数据分...

【专利技术属性】
技术研发人员:刘军孙皓陈平周祥伟张海洋
申请(专利权)人:中国民航信息网络股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1