一种业务文档处理方法、装置及服务器制造方法及图纸

技术编号:20242535 阅读:20 留言:0更新日期:2019-01-29 23:23
本说明书公开了一种业务文档处理方法、装置及服务器,包括:识别业务语义块中的第一类型分隔标识,第一类型分隔标识将业务语义块分隔为多个语义子块;基于第一类型分隔标识,从多个语义子块中识别出程序动作子块,以程序动作子块对应的操作对象子块。

【技术实现步骤摘要】
一种业务文档处理方法、装置及服务器
本说明书涉及计算机领域,尤其涉及一种业务文档处理方法、装置及服务器。
技术介绍
很多场景都需要将业务知识、专家经验等形成业务知识文档保存起来。在以后需要处理相同的业务时,按照业务知识文档中的固定步骤去执行。随着人工智能的发展,希望计算机能够理解业务知识文档,自动化执行业务知识文档中的固定步骤。为了让计算机能够理解业务知识,目前,通过程序员将业务知识文档转换为机器步骤或由专家学习程序化脚本描述。而在人工智能领域,通过纯算法理解业务知识文档的语义。
技术实现思路
本说明书实施例通过提供一种业务文档处理方法、装置及服务器。第一方面,本说明书实施例提供一种业务文档处理方法,包括:识别业务语义块中的第一类型分隔标识,所述第一类型分隔标识将所述业务语义块分隔为多个语义子块,所述业务语义块属于所述业务文档;基于所述第一类型分隔标识,从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块。第二方面,本说明书实施例提供一种业务文档处理装置,包括:标识识别单元,用于识别业务语义块中的第一类型分隔标识,所述第一类型分隔标识将所述业务语义块分隔为多个语义子块,所述业务语义块属于所述业务文档;语义识别单元,用于基于所述第一类型分隔标识,从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块。第三方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中任一项所述方法的步骤。本说明书实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:本说明书实施例提供的业务文档处理方法、装置及服务器,第一类型分隔标识分隔业务语义块为多个语义子块,基于第一类型分隔标识从多个语义子块中识别出程序动作子块以及程序动作子块对应的操作对象子块。因此,通过第一类型分隔标识使机器能够识别业务文档中哪些部分是需要执行的程序动作,哪些部分是执行程序动作对应的操作对象,从而能够让机器准确理解业务文档,以便自动执行业务文档中的步骤,更加准确、高效。附图说明为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本说明书中实施业务文档处理方法的场景示意图;图2为本说明书实施例中第一方面提供的业务文档处理方法的流程图;图3为本说明书实施例中第一方面中业务文档处理方法的具体实施方式示意图;图4为本说明书实施例中第二方面提供的标识码分配装置的结构示意图;图5为本说明书实施例中第三方面提供的服务器的结构示意图。具体实施方式为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。请参见图1,图1为本说明书中实施业务文档处理方法的场景示意图:本端设备100,本端设备100中设置有业务文档处理系统101,用于自动化理解并执行业务文档中的步骤。在一些实施场景下,本端设备100需要与一个以上的对端设备200通信。对端设备200上的业务处理系统201用于对本端设备100执行业务文档中的步骤所产生的业务请求进行响应,并向本端设备100反馈响应结果。具体的,对端设备200具体可以为另一服务器,用于提供服务。比如,对端设备200可以为:搜索服务器,用于对本端设备100执行业务文档过程中发起的搜索相关请求进行响应。对端设备200可以为数据录入平台,用于对本端设备100执行业务文档过程中发起的录入数据请求进行响应,完成在数据录入平台的数据录入。需要说明的是,对端设备200的具体类型根据业务文档的具体内容不同而有所不同,本说明书实施例不一一举例说明对端设备200的类型。当然,也存在本端设备100不需要与对端设备200通信的场景,基于业务文档处理系统101理解并自动化执行业务文档中的步骤,完成针对本端设备100本身或者本端设备100上存储内容的检查。比如,完成对本端设备100上一个故障的分析过程;比如,完成对本端设备100上存储的程序内容的检测。很多场景都需要将业务知识、专家经验等以文档的方式保存起来,形成业务文档。在以后需要处理相同业务时,按照业务文档中的步骤去执行。随着人工智能的发展,希望计算机能够理解业务文档,按照业务文档中步骤自动化执行。例如,基于业务文档自动执行:一个项目上线的检查项、一个故障的分析过程等。通过业务文档中的第一类型分隔标识,使机器能够准确理解业务文档中哪些部分是需要执行的程序动作,哪些部分是程序动作对应的操作对象,从而能够让机器准确理解业务文档,并且更加高效、准确的自动化执行业务文档中的步骤。第一方面,本说明书实施例提供了一种业务文档处理方法,应用于本端设备100。参考图2所示,该业务文档处理方法包括如下步骤S202-S204:S202:识别业务语义块中的第一类型分隔标识,第一类型分隔标识将业务语义块分隔为多个语义子块。业务语义块属于业务文档,业务文档的语言可以为中文,英文等用户可读语言形成的文档。业务文档由一个以上的业务内容项构成,业务内容项由一个以上的语义子块构成。在本说明书实施例中,从业务文档中确定出业务语义块。在一可选的实施方式中,通过如下步骤从业务文档中获取业务语义块:步骤02:读取业务文档,业务文档基于预设格式标识划分为N个业务内容项,N为大于或等于1的整数。在本说明书实施例中,N个业务内容项可以具有执行顺序,也可以是不分先后顺序的独立执行。在一可选的实施方式中,预设格式标识可以是对业务内容项的项编号,N个业务内容项各自具有项编号。本说明书实施例不限定项编号的形式,在具体实施过程中,项编号可以为数字编号、字母编号、或者组合编号。举例来讲,业务文档可以为如下样式,但是不限于如下样式:“XX自动化流程1、业务内容项A2、业务内容项B3、业务内容项C”在另一可选的实施方式中,预设格式标识可以是针对业务内容项的段落标识,从而N个业务内容项各自成段落。比如,段落标识可以是:缩进k个字符。举例来讲,缩进两个字符、缩进一个字符等等。步骤04:基于预设格式标识确定业务文档的N个业务内容项。在步骤04中,可以是识别当前的预设格式标识和下一预设格式标识,将当前的预设格式标识与下一预设格式标识之间的内容确定为业务内容项。若识别不到下一预设格式标识,则将当前的预设格式标识之后的内容确定为业务内容项。从而,确定出业务文档的N个业务内容项。步骤06:基于第二类型分隔标识,从N个业务内容项中识别一个以上业务语义块。在本说明书实施例中,第二类型分隔标识与第一类型分隔标识不同。业务内容项中有不存在第二类型分隔标识的、也有存在一个或者多个第二类型分隔标识的。在具体实施过程中,第二类型分隔标识包括第一部分和第二部分,第一部分与第二部分之间可以没有先后顺序。第二类型分隔标识的第一部分属于业务文档中的语义标点符号,第二类型分本文档来自技高网...

【技术保护点】
1.一种业务文档处理方法,其特征在于,包括:识别业务语义块中的第一类型分隔标识,所述第一类型分隔标识将所述业务语义块分隔为多个语义子块,所述业务语义块属于所述业务文档;基于所述第一类型分隔标识,从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块。

【技术特征摘要】
1.一种业务文档处理方法,其特征在于,包括:识别业务语义块中的第一类型分隔标识,所述第一类型分隔标识将所述业务语义块分隔为多个语义子块,所述业务语义块属于所述业务文档;基于所述第一类型分隔标识,从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块。2.如权利要求1所述的业务文档处理方法,其特征在于,在所述从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块之后,还包括:对所述操作对象子块中的操作对象执行所述程序动作子块所表征的程序动作,产生发送给对端设备的业务请求;获取所述对端设备对所述业务请求的响应结果。3.如权利要求1所述的业务文档处理方法,其特征在于,在所述从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块之前,还包括:识别所述多个语义子块中是否存在判断提示子块;如果存在,将所述判断提示子块相邻的语义子块确定为判断结果子块;如果不存在,执行所述基于所述第一类型分隔标识从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块的步骤。4.如权利要求3所述的所述的业务文档处理方法,其特征在于,在所述将所述判断提示子块相邻的语义子块确定为判断结果子块之后,还包括:将与所述判断结果子块下一相邻的语义子块确定为所述判断结果子块对应的业务执行子块;对特定内容的判断结果满足所述判断结果子块表征的条件时,执行所述业务执行子块对应的业务内容。5.如权利要求1所述的业务文档处理方法,其特征在于,所述基于所述第一类型分隔标识,从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块,包括:基于所述业务语义块中的第一类型分隔标识,从所述业务语义块中识别出M个语义子块,所述业务语义块基于M-1个第一类型分隔标识分隔为M个语义子块,M为大于1的整数;将所述M个语义子块中处于第一预设位置的语义子块确定为程序动作语义子块;将所述M个语义子块中处于第二预设位置的语义子块确定为所述程序动作语义子块对应的操作对象,所述第二预设位置与所述第一预设位置不同。6.如权利要求1所述的业务文档处理方法,其特征在于,所述基于所述第一类型分隔标识,从所述多个语义子块中识别出程序动作子块以及所述程序动作子块对应的操作对象子块,包括:基于所述业务语义块中的第一类型分隔标识,从所述业务语义块中识别以所述第一类型分隔标识分隔开的两个语义子块;将所述两个语义子块中位于所述第一类型分隔标识第一侧的语义子块,识别为程序动作子块;将所述两个语义子块位于所述第一类型分隔标识第二侧的语义子块,识别为所述程序动作子块对应的操作对象,第二侧与第一侧不同。7.如权利要求1-6中任一项所述的业务文档处理方法,其特征在于,在所述识别业务语义块中的第一类型分隔标识之前,还包括:读取业务文档,其中,所述业务文档基于预设格式标识划分为N个业务内容项,N为大于或等于1的整数;基于所述预设格式标识,确定所述业务文档的N个业务内容项;基于第二类型分隔标识,从所述N个业务内容项中识别一个以上业务语义块。8.如权利要求7所述的业务文档处理方法,其特征在于,所述基于第二类型分隔标识,从所述N个业务内容项中识别一个以上业务语义块的步骤中,包括:对所述业务内容项执行如下步骤:分析所述业务内容项中是否存在所述第二类型分隔标识;如果存在,将所述业务内容项识别为基于所述第二类型分隔标识分隔开的多个所述业务语义块;否则,确定所述业务内容项包括单个所述业务语义块。9.如权利要求8所述的业务文档处理方法,其特征在于,所述第二类型分隔标识包括:第一部分和第二部分;其中,所述第一部分属于业务文档中的语义标点符号,所述第二部分为与所述语义标点符号不同的第一特定分隔符号。10.如权利要求9所述的业务文档处理方法,其特征在于,在所述分析所述业务内容项中是否存在所述第二类型分隔标识之后,还包括:如果存在,在执行所述业务内容项时,丢弃所述第二类型分隔标识中与所述第一特定分隔符相邻的语义标点符号。11.如权利要求1所述的业务文档处理方法,其特征在于,所述程序动作子块,具体用于:在目标对话框中输入所述操作对象,和/或对所述操作对象进行触控操作。12.如权利要求1所述的业务文档处理方法,其特征在于,所述第一类型分隔标...

【专利技术属性】
技术研发人员:吴大龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1