文档处理方法、装置、介质及电子设备制造方法及图纸

技术编号:24121511 阅读:21 留言:0更新日期:2020-05-13 03:13
本发明专利技术提供了一种文档处理方法,包括:解析产品开发文档得到所述产品开发文档的内容,并基于所述产品开发文档的内容生成产品险种对应关系表;解析产品条款文档得到所述产品条款文档的内容,并基于所述产品条款文档的内容生成文本文档;从所述文本文档中提取字段信息,并基于所述字段信息生成产品条款信息表;以及对所述产品险种对应关系表和所述产品条款信息表进行匹配合并,得到险种责任配置表,基于险种责任配置表,可以通过结构化查询语言对客户的保单信息数据进行查询、加工,并通过一定装置以可视化界面的形式展现给用户。例如当保险代理人为用户时,该可视化界面可以让代理人直观的看到客户保障缺失情况,提升让客户加保的成功率。

【技术实现步骤摘要】
文档处理方法、装置、介质及电子设备
本专利技术涉及文档处理的
,具体而言,涉及一种文档处理法、装置、介质及电子设备。
技术介绍
众所周知,保险业区别于传统行业的主要原因为保险本身是一种服务,所谓的保险产品其实就是一纸合同,保险人需要对客户履行的服务承诺都记录在该合同中,售前我们称之为保险产品条款,售后则称为保险合同。对于客户来说,当客户手中存有多张复杂责任的保险合同时,很难轻易的理清自己目前所拥有的保障权利。同样对于保险人来说,也很难分辨出现有的客户群体中哪些客户的保障还不够全面,这样不利于对客户进行二次开发。例如,在新产品和核心系统开发之初,由于产品条款本身的复杂性和业务优先于系统的原则,往往在系统中只会存储基本的产品信息,如险种代码、险种名称、险类等。若要梳理清楚各个产品责任并匹配核心系统的险种代码,只能通过人工阅读条款和翻阅系统开发时的产品管理文档。考虑到这种方式耗费人力物力较大,且存在较高的错误率。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例的目的在于提供一种文档处理方法、装置、介质及电子设备。该方法可以通过解析产品开发文档和产品条款文档将两者的内容进行匹配,这样在提升工作效率的同时还可以一定程度上降低错误率,并且基于险种责任配置表可以通过结构化查询语言对客户的保单信息数据进行查询、加工,并通过一定装置以可视化界面的形式展现给用户。例如,当保险代理人为用户时,该可视化界面可以让代理人直观的看到客户保障缺失情况,提升让客户加保的成功率。再例如,当客户为用户时,该可视化界面可以让客户清楚的了解到目前所有的保障情况,提升客户对保险服务的体验。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本专利技术实施例的第一方面,提供了一种文档处理方法,包括:解析产品开发文档得到所述产品开发文档的内容,并基于所述产品开发文档的内容生成产品险种对应关系表;解析产品条款文档得到所述产品条款文档的内容,并基于所述产品条款文档的内容生成文本文档;从所述文本文档中提取字段信息,并基于所述字段信息生成产品条款信息表;以及对所述产品险种对应关系表和所述产品条款信息表进行匹配合并,得到险种责任配置表。在本专利技术的一些实施例中,解析所述产品开发文档得到所述产品开发文档的内容包括:通过VBA对产品开发文档进行读取、拆解、和/或赋值,得到所述产品开发文档的内容。在本专利技术的一些实施例中,所述产品条款文档的格式为PDF,解析产品条款文档得到所述产品条款文档的内容包括:通过Python对PDF格式的产品条款文档解析,得到所述产品条款文档的内容。在本专利技术的一些实施例中,从所述文本文档中提取字段信息包括:通过正则表达式规则对所述文本文档进行处理,以获取产品条款名称;根据所述产品条款名称从所述文本文档中提取字段信息。在本专利技术的一些实施例中,根据所述产品条款名称从所述文本文档中提取字段信息包括:根据所述产品条款名称对所述文本文档中的产品条款所属险类进行分类;根据所述产品条款所属的险类确定所述产品条款所需提取的字段名称;根据所述产品条款所需提取的字段名称从所述文本文档中提取字段信息。在本专利技术的一些实施例中,根据所述产品条款所需提取的字段名称从所述文本文档中提取字段信息包括:基于所述产品条款所需提取的字段名称使用正则表达式规则、doc2vec、和/或文本的位置信息从所述文本文档中提取字段信息。在本专利技术的一些实施例中,对所述产品险种对应关系表和所述产品条款信息表进行匹配合并,得到所述险种责任配置表包括:根据所述产品险种对应关系表中的险种与所述产品条款信息表中的险类的相似度,对所述产品险种对应关系表的内容和所述产品条款信息表的内容进行匹配合并,得到所述险种责任配置表。根据本专利技术实施例的第二方面,提供了一种文档处理装置,包括:第一解析模块,用于解析产品开发文档得到所述产品开发文档的内容,并基于所述产品开发文档的内容生成产品险种对应关系表;第二解析模块,用于解析产品条款文档得到所述产品条款文档的内容,并基于所述产品条款文档的内容生成文本文档;提取模块,用于从所述文本文档中提取字段信息,并基于所述字段信息生成产品条款信息表;以及匹配合并模块,用于对所述产品险种对应关系表和所述产品条款信息表进行匹配合并,得到险种责任配置表。在本专利技术的一些实施例中,上述第一解析模块配置为:通过VBA对产品开发文档进行读取、拆解、和/或赋值,得到所述产品开发文档的内容。在本专利技术的一些实施例中,所述产品条款文档的格式为PDF,上述第二解析模块配置为:通过Python对PDF格式的产品条款文档解析,得到所述产品条款文档的内容。在本专利技术的一些实施例中,上述提取模块包括:获取模块,用于通过正则表达式规则对所述文本文档进行处理,以获取产品条款名称;第一提取模块,用于根据所述产品条款名称从所述文本文档中提取字段信息。在本专利技术的一些实施例中,上述第一提取模块包括:分类模块,用于根据所述产品条款名称对所述文本文档中的产品条款所属险类进行分类;确定模块,用于根据所述产品条款所属的险类确定所述产品条款所需提取的字段名称;第一提取模块的子模块,用于根据所述产品条款所需提取的字段名称从所述文本文档中提取字段信息。在本专利技术的一些实施例中,上述第一提取模块的子模块配置为:基于所述产品条款所需提取的字段名称使用正则表达式规则、doc2vec、和/或文本的位置信息从所述文本文档中提取字段信息。在本专利技术的一些实施例中,上述匹配合并模块配置为:根据所述产品险种对应关系表中的险种与所述产品条款信息表中的险类的相似度,对所述产品险种对应关系表的内容和所述产品条款信息表的内容进行匹配合并,得到所述险种责任配置表。根据本专利技术实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的文档处理方法。根据本专利技术实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的文档处理方法。本专利技术实施例提供的技术方案可以包括以下有益效果:在本专利技术的一些实施例所提供的技术方案中,通过解析产品开发文档和产品条款文档将两者的内容进行匹配,这样在一定程度上降低了错误率,并且基于险种责任配置表可以通过结构化查询语言对客户的保单信息数据进行查询、加工,并通过一定装置以可视化界面的形式展现给用户。例如,当保险代理人为用户时,该可视化界面可以让代理人直观的看到客户保障缺失情况,提升让客户加保的成功率。再例如,当客户为用户时,该可视化界面可以让客户清楚的了解到目前所有的保障情况,提升客户对保险服务的体验。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,本文档来自技高网...

【技术保护点】
1.一种文档处理方法,其特征在于,包括:/n解析产品开发文档得到所述产品开发文档的内容,并基于所述产品开发文档的内容生成产品险种对应关系表;/n解析产品条款文档得到所述产品条款文档的内容,并基于所述产品条款文档的内容生成文本文档;/n从所述文本文档中提取字段信息,并基于所述字段信息生成产品条款信息表;以及/n对所述产品险种对应关系表和所述产品条款信息表进行匹配合并,得到险种责任配置表。/n

【技术特征摘要】
1.一种文档处理方法,其特征在于,包括:
解析产品开发文档得到所述产品开发文档的内容,并基于所述产品开发文档的内容生成产品险种对应关系表;
解析产品条款文档得到所述产品条款文档的内容,并基于所述产品条款文档的内容生成文本文档;
从所述文本文档中提取字段信息,并基于所述字段信息生成产品条款信息表;以及
对所述产品险种对应关系表和所述产品条款信息表进行匹配合并,得到险种责任配置表。


2.根据权利要求1所述的方法,其特征在于,解析所述产品开发文档得到所述产品开发文档的内容包括:
通过VBA对产品开发文档进行读取、拆解、和/或赋值,得到所述产品开发文档的内容。


3.根据权利要求1所述的方法,其特征在于,所述产品条款文档的格式为PDF,解析产品条款文档得到所述产品条款文档的内容包括:
通过Python对PDF格式的产品条款文档解析,得到所述产品条款文档的内容。


4.根据权利要求1所述的方法,其特征在于,从所述文本文档中提取字段信息包括:
通过正则表达式规则对所述文本文档进行处理,以获取产品条款名称;
根据所述产品条款名称从所述文本文档中提取字段信息。


5.根据权利要求4所述的方法,其特征在于,根据所述产品条款名称从所述文本文档中提取字段信息包括:
根据所述产品条款名称对所述文本文档中的产品条款所属险类进行分类;
根据所述产品条款所属的险类确定所述产品条款所需提取的字段名称;
根据所述产品条款所需提取的字段名称从所述文本文档中提取字段信息。


6.根据权...

【专利技术属性】
技术研发人员:赵丽赵文鹏李永峰
申请(专利权)人:泰康保险集团股份有限公司泰康人寿保险有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1