【技术实现步骤摘要】
一种自动检索互联网经营企业违规经营的方法
本专利技术涉及一种检索违规经营的方法,尤其涉及一种自动检索互联网经营企业违规经营的方法。
技术介绍
在互联网经营企业中,存在着不按照国家法律法规要求违规经营的行为,检察机关或行政执法单位需要对其进行监管。目前判别互联网经营企业违规经营的方法主要通过人工手动输入互联网经营企业网址、进行浏览、发现并判定违规行为。但是因为互联网经营企业多、经营范围广、经营内容杂,导致检索效率低、发现违规行为慢、判定违规行为难。
技术实现思路
为了解决上述技术所存在的不足之处,本专利技术提供了一种自动检索互联网经营企业违规经营的方法。为了解决以上技术问题,本专利技术采用的技术方案是:一种自动检索互联网经营企业违规经营的方法,整体步骤如下:结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违 ...
【技术保护点】
1.一种自动检索互联网经营企业违规经营的方法,其特征在于:所述方法的整体步骤如下:/n结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违法事实、法律依据及证据内容进行输出,等待动作处理。/n
【技术特征摘要】
1.一种自动检索互联网经营企业违规经营的方法,其特征在于:所述方法的整体步骤如下:
结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违法事实、法律依据及证据内容进行输出,等待动作处理。
2.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述业务建模包括以下步骤:
I、属性配置:在数据资源的管理平台对需要存储的关键信息进行基础属性配置;
II、采集配置:在互联网数据采集平台进行采集关键词、采集网站的采集配置,一般情况下采集的信息包括企业基本信息、企业的网站域名、企业的经营许可证信息、企业的信息服务资格证书、交易服务证书电子证照信息;
III、规则配置:在规则管理平台即规则引擎,对数据处理进行规则配置,平台间通过接口协议的方式进行规则调用。
3.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述互联网数据采集系统采集的内容包括文字和图片两种格式,如果是图片信息则需要通过文本识别工具进行信息抽取,具体步骤如下:
S1、文本采集:通过预先配置好的采集模板,有目的性的、定向的采集在经营企业的网页中与模板配置相关的文本内容,并按照属性配置进行文本的存储;
S2、证照采集:将经营企业网页中公布的图片格式的证照信息存储到FTP服务器的固定位置,并且支持JPG、PNG、BMP、GIF多种图片格式的文件存储;
S21、文本识别:通过调用OCR文字识别接口服务,将步骤S2中已采集并存储图片上的文字信息,智能识别成可编辑和存储的文本内容,并按照预先配置好的属性字段进行识别信息的存储;文字识别的过程包含图像的输入、预处理、版面分析、字符切割、字符识别、校对步骤。
4.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述规则处理包括以下步骤:
自动检索互联网经营企业违规的方法需要通过规则处理模块完成一系列信息处理操作,以实现违规行...
【专利技术属性】
技术研发人员:陈艳,郑淳滢,宫嘉晨,
申请(专利权)人:长春嘉诚信息技术股份有限公司,
类型:发明
国别省市:吉林;22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。