基于人工智能的文本标签化方法、电子装置及存储介质制造方法及图纸

技术编号:25551106 阅读:16 留言:0更新日期:2020-09-08 18:50
本发明专利技术涉及一种人工智能技术,揭露了一种基于人工智能的文本标签化方法,该方法包括:接收用户上传的目标文书和输入的业务需求;向用户提供预设的模板集合,接收用户从所述模板集合中选择模板或向用户提供画布、预设组件,接收用户根据所述预设组件在所述画布中创建自定义模板;根据所述业务需求和用户选择或创建的模板,采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果;显示所述标签化提取结果。本发明专利技术还提供一种电子装置及计算机可读存储介质。本发明专利技术能够提供一种针对各类文书的数据、模型、业务整合系统架构,为各类文书的篇章解析、核心内容提取、关键字段识别等操作提供端到端的解决方案。

【技术实现步骤摘要】
基于人工智能的文本标签化方法、电子装置及存储介质
本专利技术涉及人工智能
,尤其涉及一种基于人工智能的文本标签化方法、电子装置及计算机可读存储介质。
技术介绍
近年来,人工智能技术作为新一代科技革命核心,受到国家重点关注。对于传统行业(例如银行、证券等传统金融机构),科技化转型已成必然趋势。但对这些机构而言,要精准、快捷、高性价比地实现业务流程智能化、自动化升级并不轻松。原因如下:其一,这些机构由于自身技术能力和资源限制,缺乏测试环境,降低了创新技术和产品的推出效率;其二,行业对于数据和生产系统的管控非常严格,在引入一项新技术时,需要从研发、开发、测试、部署等诸多环节严格把控,一套流程走下来耗时耗力;其三,作为技术提供方的科技机构,也常因为成立时间短、规模小、业务范围窄、业务理解不深入、技术路线庞杂等因素,而难以将技术快速落地。而由于传统行业存在大量归档文件与新增进件,几乎所有文书都存在文本标签化需求。文本标签化,即针对半结构化或纯粹使用自然语言书写的文书,将其关键章节/字段的标题/名称以及对应的内容/数值提取出来,以层次化的方式(通常为表格或特殊文本标记格式,例如XML)呈现,以便于业务员、审核员等对文书核心内容进行快速解读,并方便进入数据仓库后的管理与操作。这一过程如同为文书中指定的字段打上类型标签,因而称为标签化(Tagging)。目前,针对传统行业的文本标签化需求,出现了一些自动化解决方案,例如机器人流程自动化(RoboticProcessAutomation,RPA)方案或人工智能开放平台。但是,现有方案可能存在以下缺陷:技术本身结构简单,功能定制,缺乏对深层语义理解的复杂模型;方案与RPA框架绑定较多,不是可插拔的,灵活度与迁移能力不足;使用的模型在整个流程中各自运行,未涉及集成;平台只陈列技术,不深入设计技术间的关联;平台技术丰富,但服务依然是定制的,通过申请特定技术的接口或安装包来实现;平台只提供技术能力,不负责规划业务逻辑,是偏技术侧的。
技术实现思路
有鉴于此,本专利技术提出一种基于人工智能的文本标签化方法、电子装置及计算机可读存储介质,以解决至少一个上述技术问题。首先,为实现上述目的,本专利技术提出一种基于人工智能的文本标签化方法,该方法包括步骤:接收用户上传的目标文书和输入的业务需求;向用户提供预设的模板集合,接收用户从所述模板集合中选择模板或向用户提供画布、预设组件,接收用户根据所述预设组件在所述画布中创建自定义模板;根据所述业务需求和用户选择或创建的模板,采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果;及显示所述标签化提取结果。可选地,所述向用户提供画布、预设组件,接收用户根据所述预设组件在所述画布中创建自定义模板包括:在页面中为用户提供所述画布,并将后台所支持的多种算法模型和关系操作符作为所述预设组件提供给用户选择;接收用户选择所述预设组件的操作;根据用户对所选择的组件的逻辑配置建立每个组件之间的逻辑关系;根据用户对所选择的每个组件的参数配置从后台获取对应的规则和算法模型;通过用户所选择的组件及所述逻辑配置和参数配置创建工作流,从而生成相应的自定义模板。可选地,所述选择所述预设组件的操作包括拖拽所需的组件到所述画布中;所述逻辑配置包括按照业务逻辑连接所述画布中所选择的组件;所述参数配置为依次点击所述选择的每个组件后,在显示的参数栏中输入所述组件对应的参数。可选地,所述根据所述业务需求和用户选择或创建的模板,采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果的步骤包括:按照所述模板对应的工作流中的连接顺序执行各个组件,通过各个组件对应的算法模型或规则完成对所述目标文书的解析和提取,得到所述标签化提取结果。可选地,所述文本提取技术包括区块级信息提取,所述参数配置包括:将所述组件配置为区块级信息提取算法模型,并配置所要提取的区块级信息对应的关键词;所述采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果的步骤包括:根据所述关键词采用所述区块级信息提取算法模型搜索所述目标文书,得到所述关键词对应的一个或多个区块,将所述一个或多个区块作为所述标签化提取结果;将所述标签化提取结果上传至区块链中。可选地,所述文本提取技术包括字段级信息提取,所述参数配置包括:将所述组件配置为字段级信息提取算法模型,并配置所要提取的字段值或字段类型;所述采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果的步骤包括:根据所述字段值或字段类型采用所述字段级信息提取算法模型搜索所述目标文书,得到一个或多个字段,将所述一个或多个字段作为所述标签化提取结果;将所述标签化提取结果上传至区块链中。可选地,所述方法在向用户提供画布、预设组件或模板集合时还包括:根据用户上传的所述目标文书的类型和所述业务需求,从所述模板集合中自动筛选适合的模板并推荐给用户,或者当用户选择创建自定义模板时,自动筛选适合的预设组件并推荐给用户。可选地,所述方法在接收用户根据所述预设组件在所述画布中创建自定义模板后还包括步骤:当用户在解析进度流程图中选取所述自定义模板中的一个组件节点时,显示在所述组件节点进度下的提取内容,以供用户确认所述自定义模板中的每个组件是否得到了预期的提取结果。此外,为实现上述目的,本专利技术还提供一种电子装置,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的文本标签化系统,所述文本标签化系统被所述处理器执行时实现如上述的基于人工智能的文本标签化方法的步骤。进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有文本标签化系统,所述文本标签化系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于人工智能的文本标签化方法的步骤。相较于现有技术,本专利技术所提出的基于人工智能的文本标签化方法、电子装置及计算机可读存储介质,可以提出一种针对各类文书的数据、模型、业务整合系统架构,为各类文书的篇章解析、核心内容提取、关键字段识别等操作提供端到端的解决方案,界面操作简便,迁移与复用能力高。附图说明图1是本专利技术电子装置一可选的硬件架构的示意图;图2是本专利技术文本标签化系统较佳实施例的程序模块示意图;图3是本专利技术中一种创建自定义模板页面的示意图;图4是本专利技术基于人工智能的文本标签化方法较佳实施例的流程示意图;图5是图4的步骤S402中的为用户提供画布和预设组件,并接收用户根据预设组件在画布中创建自定义模板的细化流程示意图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施本文档来自技高网
...

【技术保护点】
1.一种基于人工智能的文本标签化方法,其特征在于,所述方法包括步骤:/n接收用户上传的目标文书和输入的业务需求;/n向用户提供预设的模板集合,接收用户从所述模板集合中选择模板或向用户提供画布、预设组件,接收用户根据所述预设组件在所述画布中创建自定义模板;/n根据所述业务需求和用户选择或创建的模板,采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果;及/n显示所述标签化提取结果。/n

【技术特征摘要】
1.一种基于人工智能的文本标签化方法,其特征在于,所述方法包括步骤:
接收用户上传的目标文书和输入的业务需求;
向用户提供预设的模板集合,接收用户从所述模板集合中选择模板或向用户提供画布、预设组件,接收用户根据所述预设组件在所述画布中创建自定义模板;
根据所述业务需求和用户选择或创建的模板,采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果;及
显示所述标签化提取结果。


2.如权利要求1所述的基于人工智能的文本标签化方法,其特征在于,所述向用户提供画布、预设组件,接收用户根据所述预设组件在所述画布中创建自定义模板包括:
在页面中为用户提供所述画布,并将后台所支持的多种算法模型和关系操作符作为所述预设组件提供给用户选择;
接收用户选择所述预设组件的操作;
根据用户对所选择的组件的逻辑配置建立每个组件之间的逻辑关系;
根据用户对所选择的每个组件的参数配置从后台获取对应的规则和算法模型;
通过用户所选择的组件及所述逻辑配置和参数配置创建工作流,从而生成相应的自定义模板。


3.如权利要求2所述的基于人工智能的文本标签化方法,其特征在于:
所述选择所述预设组件的操作包括拖拽所需的组件到所述画布中;
所述逻辑配置包括按照业务逻辑连接所述画布中所选择的组件;
所述参数配置为依次点击所选择的每个组件后,在显示的参数栏中输入所述组件对应的参数。


4.如权利要求1或2所述的基于人工智能的文本标签化方法,其特征在于,所述根据所述业务需求和用户选择或创建的模板,采用相应的文本提取技术解析所述目标文书并提取所需的文本,得到标签化提取结果的步骤包括:
按照所述模板对应的工作流中的连接顺序执行各个组件,通过各个组件对应的算法模型或规则完成对所述目标文书的解析和提取,得到所述标签化提取结果。


5.如权利要求2或3所述的基于人工智能的文本标签化方法,其特征在于,所述文本提取技术包括区块级信息提取,所述参数配置包括:
将所述组件配置为区块级信息提取算法模型,并配置所要提取的区块级信息对应的关键词;
所述采用相应的文本提取...

【专利技术属性】
技术研发人员:朱昱锦董润华徐国强邱寒
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1