一种基于面向对象语言处理的档案管理方法技术

技术编号:30409138 阅读:14 留言:0更新日期:2021-10-20 11:23
本发明专利技术请求保护的一种基于面向对象语言处理的档案管理方法,面向多查询语言平台,通过获取待处理档案,对待处理档案进行预处理,对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。通过确定所述待处理档案的处理优先级,对档案的查询处理进行个性化需求匹配,以及基于客观条件,即当前资源调度情况结合进行数据查询平台的选取和优先级排序,真正做到满足多查询语言平台的用户需求的查询条件以及符合客观资源情况的查询操作。及符合客观资源情况的查询操作。及符合客观资源情况的查询操作。

【技术实现步骤摘要】
一种基于面向对象语言处理的档案管理方法


[0001]本专利技术涉及数据处理
,尤其涉及一种基于面向对象语言处理的档案管理方法。

技术介绍

[0002]目前,数据已经渗透到每一个行业和业务领域,庞大的数据资源使得各个领域开始了量化进程。为了在合理的时间内获取、管理、处理、并整理为帮助公司、企业经营和决策的资讯信息,对于描述各种业务场景及其分析思路的数据相关的模型和相关报表的需求层出不穷。
[0003]当查询需求发生变更时,则需要对相关数据进行重新调整、组包和部署,以便产生一个新的程序代码适用于改变的查询需求。当涉及较大改造并重新生成代码时,会浪费大量的人力成本,并且由于人工修改还可能提高功能隐患出现的风险,可见现有的数据查询处理无法满足不同业务查询请求的快速处理的要求。
[0004]同时,对于档案的查询,由于档案类型以及档案在用户之间交互的复杂性,导致相关档案的查询存在优先级的先后顺序,但目前存在的多种查询语言的查询性能参差不齐,如果均使用其中的一种查询语言,显然不符合个性化的需求,因此,如何基于用户交互数据和档案属性数据完成档案的查询,是当前数据查询上亟待需要解决的问题。

技术实现思路

[0005]针对于上述问题,本专利技术提供一种基于面向对象语言处理的档案管理方法,其特征在于,包括:
[0006]获取待处理档案,对待处理档案进行预处理;
[0007]对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据;
[0008]基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。
[0009]进一步地,所述获取待处理档案,对待处理档案进行预处理,包括:
[0010]获取不同档案类型对应的待处理档案;分别对所述待处理档案进行逐条解析,获取预先选择的档案类型对应的待处理档案;
[0011]对所述预先选择的档案类型对应的待分析档案进行分析,根据预先配置的指标参数获取分析后的档案中的属性指标;
[0012]对所述属性指标进行统计,并输出统计结果;
[0013]所述指标参数包括档案管理人员通常关心的指标,根据系统默认的指标参数获取待处理档案中的档案基本指标和交互属性基本指标;
[0014]其中,档案基本指标包括档案媒体类型、档案数据体量、档案分布式需求;交互属性基本指标包括档案生成时延、http档案下载速率、ftp档案下载速率、下载时长和丢包率。
[0015]进一步地,所述对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,还包括:
[0016]获取用户的阅读档案和档案修改数据,根据所述阅读档案和所述档案修改数据,生成用户的浏览及修改明细信息,根据所述浏览及修改明细信息,生成所述用户行为的样本数据;
[0017]对所述用户行为的样本数据进行分类聚合,以得到所述样本数据的特征集;
[0018]从所述特征集包含的特征字段中选取第一预定数量个特征字段,根据选取出的预定数量个特征字段,从所述特征集中获取第二预定数量的特征数据,基于获取到的所述特征数据,通过逻辑回归算法进行模型训练;
[0019]从所述用户行为的样本数据中获取在预定时间内进行了浏览但并未修改的样本数据,根据获取到的在所述预定时间内进行了浏览但并未修改的样本数据,获得特征字段的值,根据获得的特征字段的值,调用所述逻辑回归模型进行计算,得到分类后待处理样本。
[0020]进一步地,所述基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台,还包括:
[0021]基于所述用户交互数据和所述元数据,确定所述待处理档案的处理优先级;
[0022]基于所述待处理档案的处理优先级,确定合适的语言查询平台;
[0023]所述语言查询平台包括sql语言查询平台、hql语言查询平台、MongoDB语言查询平台;
[0024]所述sql语言查询平台采用结构化查询语言,以二维表形式存储和查询数据;
[0025]所述hql语言查询平台采用分布式结构,hive构建分布式查询语言;
[0026]所述MongoDB采用spring data框架中的PagingAndSortingRepository接口实现在分页查询。
[0027]本专利技术请求保护的一种基于面向对象语言处理的档案管理方法,面向多查询语言平台,通过获取待处理档案,对待处理档案进行预处理,对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。通过确定所述待处理档案的处理优先级,对档案的查询处理进行个性化需求匹配,以及基于客观条件,即当前资源调度情况结合进行数据查询平台的选取和优先级排序,真正做到满足多查询语言平台的用户需求的查询条件以及符合客观资源情况的查询操作。
附图说明
[0028]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0029]图1为本专利技术所涉及的一种基于面向对象语言处理的档案管理方法的工作流程图;
[0030]图2为本专利技术所涉及的一种基于面向对象语言处理的档案管理方法的实施例一;
[0031]图3为本专利技术所涉及的一种基于面向对象语言处理的档案管理方法的实施例二;
[0032]图4为本专利技术所涉及的一种基于面向对象语言处理的档案管理方法的实施例三。
具体实施方式
[0033]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]本专利技术的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
[0035]参照附图1,本专利技术提供一种基于面向对象语言处理的档案管理方法,其特征在于,包括:
[0036]获取待处理档案,对待处理档案进行预处理;
[0037]对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据;
[0038]基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。...

【技术保护点】

【技术特征摘要】
1.一种基于面向对象语言处理的档案管理方法,其特征在于,包括:获取待处理档案,对待处理档案进行预处理;对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据;基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。2.如权利要求1所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述获取待处理档案,对待处理档案进行预处理,包括:获取不同档案类型对应的待处理档案,分别对所述待处理档案进行逐条解析,获取预先选择的档案类型对应的待处理档案;对所述预先选择的档案类型对应的待分析档案进行分析,根据预先配置的指标参数获取分析后的档案中的属性指标;对所述属性指标进行统计,并输出统计结果;所述指标参数包括档案管理人员通常关心的指标,根据系统默认的指标参数获取待处理档案中的档案基本指标和交互属性基本指标;其中,档案基本指标包括档案媒体类型、档案数据体量、档案分布式需求;交互属性基本指标包括档案生成时延、http档案下载速率、ftp档案下载速率、下载时长和丢包率。3.如权利要求2所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,还包括:获取用户的阅读档案和档案修改数据,根据所述阅读档案和所述档案修改数据,生成用户的浏览及修改明细信息,根据所述浏览及...

【专利技术属性】
技术研发人员:周杏李帅
申请(专利权)人:中盾创新档案管理北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1