本申请实施例公开了一种法规制度的搜索方法、装置、存储介质及计算机设备,涉及企业信息管理领域。本申请的方法包括:解析法规制度文件得到文本数据;对所述文本数据进行知识抽取、知识融合和知识加工得到知识图谱;接收用户的搜索请求;其中,所述搜索请求携带搜索关键词;根据云搜索模型在所述知识图谱中搜索所述搜索关键词对应的搜索结果,本申请通过对法规制度文件的智能化解析和管理,为企业内控管理提供精准的风险点和控制点服务,有效的提升企业风险内控精细化管理水平。企业风险内控精细化管理水平。企业风险内控精细化管理水平。
【技术实现步骤摘要】
法规制度的搜索方法、装置、存储介质及计算机设备
[0001]本申请涉及企业信息管理领域,尤其涉及一种法规制度的搜索方法、装置、存储介质及计算机设备。
技术介绍
[0002]法规制度控制是指企业的业务经营活动都必须遵守国家的法律、法规、政策、制度以及企业规章制度(本申请中统称法规制度),法规制度是检查单位业务经营活动合法性和合规性的标准。因此企业通常会制定出确保有关法律、法规得到有效遵从的内部政策和具体的程序,通过监督和技术控制,防止一切违法违规的业务活动发生。
[0003]在企业的法规制度库的建设中,主要存在如下几个问题:
[0004]1、法规制度与业务合规活动无直接关系,这样就导致企业经营活动无据可依,或无法实时的掌握公司经营活动对法规制度的覆盖情况;
[0005]2、业务应用场景中需要对法规制度库里面的内容进行精确检索,如需要对本文进行语义的检索,传统的检索方法存在效率较低,性能较慢、检索命中率低等问题;
[0006]3、业务应用中,法规制度与企业管理风险、流程、内部控制点、合规是有关系的,如控制点的依据是制度条款,这些关系无法直观的表达出来;
[0007]经营业务活动的来源及依据是制度文件中的某一项条款,而不是整个制度文件,不利于企业合规问题的定位。
技术实现思路
[0008]本申请提供了法规制度的搜索方法、装置、存储介质及计算机设备,可以解决现有技术中法规制度搜索效率低和命中率低的问题。所述技术方案如下:
[0009]第一方面,本申请提供了一种法规制度的搜索方法,所述方法包括:
[0010]解析法规制度文件得到文本数据;
[0011]对所述文本数据进行知识抽取、知识融合和知识加工得到知识图谱;
[0012]接收用户的搜索请求;其中,所述搜索请求携带搜索关键词;
[0013]根据云搜索模型在所述知识图谱中搜索所述搜索关键词对应的搜索结果。
[0014]第二方面,本申请提供了一种法规制度的搜索装置,所述装置包括:
[0015]解析单元,用于解析法规制度文件得到文本数据;
[0016]构建单元,用于对所述文本数据进行知识抽取、知识融合和知识加工得到知识图谱;
[0017]请求单元,用于接收用户的搜索请求;其中,所述搜索请求携带搜索关键词;
[0018]响应单元,用于根据云搜索模型在所述知识图谱中搜索所述搜索关键词对应的搜索结果。
[0019]第三方面,本申请提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
[0020]第四方面,本申请提供一种计算机设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0021]本申请一些实施例提供的技术方案带来的有益效果至少包括:
[0022]基于大数据技术和知识图谱技术对法规制度文件进行知识抽取、知识表示、知识融合和知识推理,实现以企业风险、内控和合规一体化融合的知识图谱,通过该图谱可以对法规制度文件进行统一规范管理,文件之间的关联引用关系更加清晰,法规制度条款的理解更精准,条款内容具有可查可追溯。本申请通过对法规制度文件的智能化解析和管理,为企业内控管理提供精准的风险点和控制点服务,有效的提升企业风险内控精细化管理水平。
附图说明
[0023]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本申请实施例提供的网络架构的示意图;
[0025]图2是本申请实施例提供的计算机设备的软件架构图;
[0026]图3是本申请实施例提供的法规制度的搜索方法的流程示意图;
[0027]图4是本申请实施例提供的构建知识图谱的原理示意图;
[0028]图5是本申请实施例提供的搜索过程的原理示意图;
[0029]图6是本申请提供的一种法规制度的搜索装置的结构示意图;
[0030]图7是本申请提供的一种计算机设备的结构示意图。
具体实施方式
[0031]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
[0032]需要说明的是,本申请提供的法规制度的搜索方法一般由计算机设备执行,相应的,法规制度的搜索装置一般设置于计算机设备中。
[0033]图1示出了可以应用于本申请的法规制度的搜索方法或法规制度的搜索装置的示例性系统架构。
[0034]如图1所示,系统架构可以包括:计算机设备101和服务器102。计算机设备101和服务器102之间可以通过网络进行通信,网络用于上述各个单元之间提供通信链路的介质。网络可以包括各种类型的有线通信链路或无线通信链路,例如:有线通信链路包括光纤、双绞线或同轴电缆的,无线通信链路包括蓝牙通信链路、无线保真(WIreless
‑
FIdelity,Wi
‑
Fi)通信链路或微波通信链路等。
[0035]其中,服务器102中部署有关系型数据库,关系型数据库中存储企业的各个法规制度文件,计算机设备从服务器102中读取法规制度文件进行解析得到知识图谱,然后利用云搜索模型对知识图谱中进行检索得到检索结果。
[0036]其中,本申请的计算机设备101的软件架构如图2所示,包括:数据源层、存储计算
层、平台层、应用层和云搜索等模块,各个模块的功能参照下面的说明。
[0037]数据源层:对多种格式(doc、pdf)等的法规制度文件进行读取、对非结构化文件通过结构化处理技术进行识别。
[0038]存储计算层:对非结构化的法规制度文件进行结构化解析后存储在数据库中,并通过关键字建立文件索引,存储在法规制度文件搜索库中。
[0039]平台层:通过大数据技术搭建平台层,构建文档自动分类模型、文档条款解析模型、文本基本属性提取模型等法规制度文档解析引擎,并基于知识图谱对法规制度、制度条款、风险点、控制点、合规规则、组织、权限、流程等核心对象进行识别,建立对应的实体、实体属性、实体关系。
[0040]应用层:构建流程制度树、关联引用图谱、智能推荐、法规制度文档管理等应用;
[0041]云搜索:基于整体框架提供的技术支撑,结合知识图谱技术构建云搜索模型,以风险、内控、合规一体化融合为基础实现法规制度的智能检索。
[0042]需要说明的是,计算机设备101和服务器102可以是硬件,也可以是软件。当计算机设备101和服务器102为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当计算机设备101和服务器102为软件时,可以实现成多个软件或软件模本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种法规制度的搜索方法,其特征在于,包括:解析法规制度文件得到文本数据;对所述文本数据进行知识抽取、知识融合和知识加工得到知识图谱;接收用户的搜索请求;其中,所述搜索请求携带搜索关键词;根据云搜索模型在所述知识图谱中搜索所述搜索关键词对应的搜索结果。2.根据权利要求1所述的方法,其特征在于,所述解析法规制度文件生成结构化文本数据,包括:在法规制度文件的格式为word时,利用OCR光学字符识别算法解析所述法规制度文件;在法规制度文件的格式为pdf时,利用PdfBox插件解析所述法规制度文件。3.根据权利要求1或2所述的方法,其特征在于,所述知识抽取包括:对所述文本数据进行分词处理得到分词结果;对所述分词结果进行关键词提取得到关键词内容;对所述关键词内容进行知识抽取形成知识表示,以及将所述知识表示存储到数据库中。4.根据权利要求3所述的方法,所述对所述文本数据进行分词数据得到分词结果,包括:基于预设的法规制度分词库,利用最大匹配分词算法对所述文本数据进行分词处理得到分词结果。5.根据权利要求4所述的方法,其特征在于,所述知识融合,包括:对所述数据库中的知识进行实体合并、实体对齐和关系抽取形成初步的知识图谱。6.根据权利要求5所述...
【专利技术属性】
技术研发人员:樊进,陈喆,杨文鑫,蒋秋霞,郭伙平,陈雅,
申请(专利权)人:远光软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。