结合RPA和AI的文档处理方法、装置、设备及介质制造方法及图纸

技术编号:27809573 阅读:11 留言:0更新日期:2021-03-30 09:37
本申请提出一种结合RPA和AI的文档处理方法、装置、设备及介质,涉及AI和RPA技术领域,其中,方法包括:通过开启模板文档,根据模板文档中包含多个标记位置配置的查询条件,在候选内容资源中,查询符合查询条件的目标内容,避免了人工查询过程中容易出现错误的情况,进一步地,对符合查询条件的目标内容进行复制,将复制的目标内容粘贴到模板文档中对应的标记位置,以得到目标文档,不仅避免了用户人工粘贴过程中容易出现错误的问题,还提高了文档的处理效率。理效率。理效率。

【技术实现步骤摘要】
结合RPA和AI的文档处理方法、装置、设备及介质


[0001]本申请涉及计算机
,具体涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)
,尤其涉及一种结合RPA和AI的文档处理方法、装置、设备及介质。

技术介绍

[0002]机器人流程自动化(Robotic Process Automation,简称:RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。人工智能(Artificial Intelligence,简称:AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、NLP和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,人工智能可以对人的意识、思维的信息过程的模拟。
[0003]目前,从药品系统上下载各类数据时,需要人工手动去网站下载数据,抓取到对应的数据后,然后复制粘贴到对应的位置。整个人工获取数据的过程,存在及时性差、效率低、容易出错等缺点。

技术实现思路

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本申请提出一种结合RPA和AI的文档处理方法、装置、设备及存储介质,以解决现有的文档处理依赖于人工,存在及时性差、效率低、容易出错等技术问题。
[0006]本申请第一方面实施例提出了一种结合RPA和AI的文档处理方法,包括:
[0007]开启模板文档,其中,所述模板文档中包含多个标记位置;
[0008]根据各所述标记位置配置的查询条件,在候选内容资源中,查询符合所述查询条件的目标内容;
[0009]对所述目标内容进行复制;
[0010]将复制的所述目标内容粘贴到所述模板文档中对应的标记位置,以得到目标文档。
[0011]在一种可能的实现方式中,所述根据各所述标记位置配置的查询条件,在候选内容资源中,查询符合所述查询条件的目标内容之前,还包括:
[0012]访问预配置的网络地址,以得到资源页面或者资源文档;
[0013]对所述资源页面或者所述资源文档进行光学字符识别(OCR:Optical Character Recognition),得到所述候选内容资源。
[0014]在另一种可能的实现方式中,所述对所述目标内容进行复制,包括:
[0015]模拟用户操作,对所述目标内容进行复制。
[0016]在另一种可能的实现方式中,所述根据各所述标记位置配置的查询条件,在候选
内容资源中,查询符合所述查询条件的目标内容,包括:
[0017]对各所述标记位置,读取预配置的查询条件;其中,所述查询条件包括章节序号和关键词;
[0018]从所述候选内容资源中确定与所述章节序号字符匹配,或者基于自然语言处理(NLP:Natural Language Processing)确定与所述关键词语义匹配的目标内容。
[0019]在另一种可能的实现方式中,所述关键词为一个或多个。
[0020]本申请第二方面实施例提出了一种结合RPA和AI的文档处理装置,包括:
[0021]开启模块,用于开启模板文档,其中,所述模板文档中包含多个标记位置;
[0022]查询模块,用于根据各所述标记位置配置的查询条件,在候选内容资源中,查询符合所述查询条件的目标内容;
[0023]复制模块,用于对所述目标内容进行复制;
[0024]粘贴模块,用于将复制的所述目标内容粘贴到所述模板文档中对应的标记位置,以得到目标文档。
[0025]本申请第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面实施例中所述的结合RPA和AI的文档处理方法。
[0026]本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面实施例中所述的结合RPA和AI的文档处理方法。
[0027]本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行第一方面实施例所述的结合RPA和AI的文档处理方法。
[0028]本申请实施例提供的结合RPA和AI的文档处理方法、装置、设备、介质及程序产品,通过开启模板文档,根据模板文档中包含多个标记位置配置的查询条件,在候选内容资源中,查询符合查询条件的目标内容,避免了人工查询过程中容易出现错误的情况,进一步地,对符合查询条件的目标内容进行复制,将复制的目标内容粘贴到模板文档中对应的标记位置,以得到目标文档,不仅避免了用户人工粘贴过程中容易出现错误的问题,还提高了文档的处理效率。
[0029]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0030]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0031]图1为本申请实施例提供的一种结合RPA和AI的文档处理方法的流程示意图;
[0032]图2为本申请实施例提供的另一种结合RPA和AI的文档处理方法的流程示意图;
[0033]图3为本申请实施例提供的一种用于确定目标内容的流程示意图;以及
[0034]图4为本申请实施例提供的一种结合RPA和AI的文档处理装置的结构示意图。
具体实施方式
[0035]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0036]在从药品系统上下载各类数据时,供下载的网站有多个,需要重复往返的操作,而且格式、位置和数据也不一样,同样的名称就有几个说法,页码位置也不固定,给做表格的人,带来了极大的不便利。此外,还存储同义词替换的情况,如,标题名字不同,有的公司叫备注,有的公司叫参考。
[0037]相关技术中,在用户手工从网站上下载数据时,抓取到对应的数据后,复制粘贴到对应的位置。在下载PDF的数据,通过肉眼去识别,找到对应的数据,粘贴到指定的word文档中;如果PDF里面有图片,还需要手工将图片输入到word中;最后形成一个最终word文稿。
[0038]但是,现有的文档处理方法存在及时性差、效率低、容易出错等缺点,为此,本申请提出了一种结合RPA和AI的文档处理方法。
[0039]下面参考附图描述本申请实施例的结合RPA和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合RPA和AI的文档处理方法,其特征在于,包括以下步骤:开启模板文档,其中,所述模板文档中包含多个标记位置;根据各所述标记位置配置的查询条件,在候选内容资源中,查询符合所述查询条件的目标内容;对所述目标内容进行复制;将复制的所述目标内容粘贴到所述模板文档中对应的标记位置,以得到目标文档。2.根据权利要求1所述的文档处理方法,其特征在于,所述根据各所述标记位置配置的查询条件,在候选内容资源中,查询符合所述查询条件的目标内容之前,还包括:访问预配置的网络地址,以得到资源页面或者资源文档;对所述资源页面或者所述资源文档进行光学字符识别(OCR:Optical Character Recognition),得到所述候选内容资源。3.根据权利要求1所述的文档处理方法,其特征在于,所述对所述目标内容进行复制,包括:模拟用户操作,对所述目标内容进行复制。4.根据权利要求1

3任一项所述的文档处理方法,其特征在于,所述根据各所述标记位置配置的查询条件,在候选内容资源中,查询符合所述查询条件的目标内容,包括:对各所述标记位置,读取预配置的查询条件;其中,所述查询条件包括章节序号和关键词;从所述候选内容资源中确定与所述章节序号字符匹配,或者基于自然语言处理(NLP:Natural Language Processing)确定与所述关键词语义匹配的目标内容。5.根据权利要求4所述的文档处理方法,其特征在于,所述关键词为一个或多个。6.一种结合RPA和AI的文档处理装置,其特征在于,所述装置包括:开启模块,用于开启模板文档,其中,所述模板文档中包含多个标记位置;查询模块,用于根据各所述标记位置配置的查询条件,在候选内...

【专利技术属性】
技术研发人员:汪冠春胡一川褚瑞李玮潘庚生
申请(专利权)人:北京奔影网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1