文件处理方法及装置制造方法及图纸

技术编号:37815705 阅读:14 留言:0更新日期:2023-06-09 09:45
本说明书实施例提供文件处理方法及装置,其中所述文件处理方法包括:获取待处理文件,其中,所述待处理文件在数据源用户端获取;基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息;将所述关键信息与预设关键信息进行比对;在所述关键信息与所述预设关键信息一致的情况下,将所述待处理文件提供至所述待处理文件的文件需求端。本说明书的文件处理方法,对端到端之间已生成的文件进行检测,避免直接获取文件信息进行检测导致的测试准确度低的问题,提升了文件检测准确度;基于待处理文件包含的信息类型确定检测规则,从而实现对不同类型信息的分类提取,提升了关键信息的提取效率,进而提升了待处理文件的检测效率。率。率。

【技术实现步骤摘要】
文件处理方法及装置


[0001]本说明书实施例涉及计算机
,特别涉及文件处理方法及装置。

技术介绍

[0002]随着计算机技术的不断发展,在不同项目中产生的文件数量也越来越大;产生的文件会被保存下来,用于后续的项目处理。
[0003]为了保证文件的真实性,避免数据造假、错误等情况的出现,通常需要对文件进行质量检测;目前的检测方式为:直接获取用于生成文件的文件信息,对文件信息进行质量检测;然而,文件信息存在较多种类,并且应用于不同的项目场景,导致文件质量检测效率较低,并且文件质量检测准确率较低。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了文件处理方法。本说明书一个或者多个实施例同时涉及文件处理装置,文件处理系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种文件处理方法,包括:
[0006]获取待处理文件,其中,所述待处理文件在数据源用户端获取;
[0007]基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息;
[0008]将所述关键信息与预设关键信息进行比对;
[0009]在所述关键信息与所述预设关键信息一致的情况下,将所述待处理文件提供至所述待处理文件的文件需求端。
[0010]根据本说明书实施例的第二方面,提供了一种文件处理装置,包括:
[0011]获取模块,被配置为获取待处理文件,其中,所述待处理文件在数据源用户端获取;
[0012]提取模块,被配置为基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息;
[0013]比对模块,被配置为将所述关键信息与预设关键信息进行比对;
[0014]提供模块,被配置为在所述关键信息与所述预设关键信息一致的情况下,将所述待处理文件提供至所述待处理文件的文件需求端。
[0015]根据本说明书实施例的第三方面,提供了一种文件处理系统,,所述文件处理系统中包含文件处理平台、数据源用户端和文件需求端,其中:
[0016]所述数据源用户端,被配置为基于文件传输任务确定待传输文件信息,并将所述待传输文件信息发送至所述文件需求端;
[0017]所述文件处理平台,被配置为根据文件检测任务获取所述待传输文件信息,并基于所述待传输文件信息生成待处理文件;基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息;将所述关键信息与预设关键信息进行比对;在所述关键信息与
所述预设关键信息一致的情况下,将所述待处理文件提供至所述待处理文件的所述文件需求端;
[0018]所述文件需求端,被配置为接收并展示所述待处理文件。
[0019]根据本说明书实施例的第四方面,提供了一种计算设备,包括:
[0020]存储器和处理器;
[0021]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文件处理方法的步骤。
[0022]根据本说明书实施例的第五方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文件处理方法的步骤。
[0023]根据本说明书实施例的第六方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文件处理方法的步骤。
[0024]本说明书一个实施例实现了获取待处理文件,其中,所述待处理文件在数据源用户端获取;基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息;将所述关键信息与预设关键信息进行比对;在所述关键信息与所述预设关键信息一致的情况下,将所述待处理文件提供至所述待处理文件的文件需求端。
[0025]本说明书的文件处理方法,通过获取数据源用户端的待处理文件,以便后续对待处理文件做进一步的处理;基于待处理文件中包含的信息类型提取关键信息,提升了对关键信息的提取效率和准确度;通过比对关键信息和预设关键信息,实现对待处理文件的质量检测;在关键信息与预设关键信息一致的情况下,再将待处理文件提供至文件需求端,避免了错误文件的传输,提升了待处理文件的传输准确率。
附图说明
[0026]图1是本说明书一个实施例提供的一种文件处理方法的场景示意图;
[0027]图2是本说明书一个实施例提供的一种文件处理方法的流程图;
[0028]图3是本说明书一个实施例提供的一种文件处理方法的处理过程流程图;
[0029]图4是本说明书一个实施例提供的一种文件处理系统的结构示意图;
[0030]图5是本说明书一个实施例提供的一种文件处理装置的结构示意图;
[0031]图6是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0032]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0033]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0034]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描
述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0035]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0036]Tenengrad:Tenengrad函数是一种由Tenenbaum提出的,基于梯度的常用图像清晰度评价函数。
[0037]Laplacian:被定义为梯度的散度,它将一个标量函数映射为另一个标量函数,告诉我们梯度(导数/斜率)的变化程度,可类比于单变量函数的二阶导数。
[0038]Tesseract:是一个光学字符识别引擎,支持多种操作系统。
[0039]LSTM:长短期记忆网络,LongShort

TermMemory,是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。
[0040]Sobel:索伯算子(sobe本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,应用于文件处理平台,包括:获取待处理文件,其中,所述待处理文件在数据源用户端获取;基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息;将所述关键信息与预设关键信息进行比对;在所述关键信息与所述预设关键信息一致的情况下,将所述待处理文件提供至所述待处理文件的文件需求端。2.如权利要求1所述的方法,获取待处理文件,包括:确定所述数据源用户端中文件检测任务对应的数据库;在所述数据库中采集目标数据,并基于所述目标数据生成待处理文件。3.如权利要求1所述的方法,基于所述待处理文件包含的信息类型,提取所述待处理文件中的关键信息,包括:在所述待处理文件包含目标信息类型的情况下,确定所述待处理文件对应的目标提取规则;基于所述目标提取规则在所述待处理文件中提取目标关键信息。4.如权利要求3所述的方法,所述目标信息类型包含文字类型的情况下,确定所述待处理文件对应的目标提取规则,包括:确定所述待处理文件对应的文字提取规则;相应地,基于所述目标提取规则在所述待处理文件中提取目标关键信息,包括:基于所述文字提取规则在所述待处理文件中提取字段关键信息。5.如权利要求3所述的方法,所述目标信息类型包含图片类型的情况下,确定所述待处理文件对应的目标提取规则,包括:确定所述待处理文件对应的图片内容提取规则;相应地,基于所述目标提取规则在所述待处理文件中提取目标关键信息,包括:基于所述图片提取规则在所述待处理文件中提取图片内容关键信息。6.如权利要求5所述的方法,确定所述待处理文件对应的图片内容提取规则之前,还包括:基于特征提取模型对所述待处理文件中的待处理图片进行特征提取;根据特征提取结果对所述待处理图片进行裁剪,获得待处理子图片;判断所述待处理子图片是否符合图像特征指标;若是,则确定所述待处理文件对应的图片内容提取规则;若否,则针对所述待处理图片进行图片异常告警。7.如权利要求1所述的方法,将所述关键信息与预设关键信息进行比对之前,还包括:确定所述关键信息对应的项目校验规则;根据所述项目校验规则确定所述关键信息对应的预设关键信息。8.如权利要求1所述的方法,将所述关键信息与预设关键信息进行比对,包括:确定所述预设关键信息中的格式关键信息和内容关键信息...

【专利技术属性】
技术研发人员:牛弘苗亮
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1