【技术实现步骤摘要】
一种数据智能识别分发执行方法及系统
[0001]本专利技术涉及数据处理和人工智能
,尤其涉及一种数据智能识别分发执行方法及 系统。
技术介绍
[0002]由于网络的开放性,会导致网络舆情形成迅速,对社会影响巨大。特别是当出现负面的 网络舆情时,若不及时控制,很容易形成舆论危机,严重时甚至影响公共安全。对相关部门 来说,如何及时控制负面内容、有效引导,成为网络舆情管理的一大难点。在这种情况下, 建设能够迅速进行舆情数据分发的系统十分必要。
[0003]目前在传统的业务系统中,针对舆情数据的下发,需要业务员人工根据舆情数据的URL 判断该条数据下发给哪个属地,这种方式耗时时间太长而且准确率低。
[0004]因此,就需要一种能够自动进行属地下发、方便快捷、准确率高的数据智能识别分发执 行方法及系统。
技术实现思路
[0005]本专利技术的目的是为了解决现有数据识别系统分发属地耗时长、不能自动向属地分发、分 发准确率低的缺陷,提供了一种能够自动进行属地下发、方便快捷、准确率高的数据智能识 别分发执行方法及系统。
[0006]本专利技术所述的一种数据智能识别分发执行方法,包括以下步骤:
[0007]S1、采用采集取证模块对用户提交的数据进行采集;
[0008]S2、将采集到的数据进行分段得到分段矩阵;
[0009]S3、采用属地识别模块对分段矩阵进行识别;
[0010]S4、将识别结果通过数据分发模块按照区域进行划分,得到识别结果矩阵;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种数据智能识别分发执行方法,其特征在于,包括以下步骤:S1、采用采集取证模块对用户提交的数据进行采集;S2、将采集到的数据进行分段得到分段矩阵;S3、采用属地识别模块对分段矩阵进行识别;S4、将识别结果通过数据分发模块按照区域进行划分,得到识别结果矩阵;S5、根据识别结果矩阵中每列非零元素的个数自适应的开辟缓存空间,将数据分发至接收地管理模块。2.根据权利要求1所述的一种数据智能识别分发执行方法,其特征在于,所述采集取证模块包括监控单元、采集单元、抽取单元、截图单元和下载单元;在S1中,具体包括以下步骤:S11、通过所述采集单元对用户提交的数据进行多进程采集取证,所述数据为URL数据;采用所述监控单元对采集过程进行实时监控;S12、利用所述截图单元对URL数据页面进行截图;S13、在采集过程中,采用所述抽取单元对用户提交的URL数据进行实时抽取,同时采用下载单元对抽取的数据进行下载。3.根据权利要求2所述的一种数据智能识别分发执行方法,其特征在于,在S1中,所述采集单元、截图单元和抽取单元均采用restful服务的方式。4.根据权利要求1或2所述的一种数据智能识别分发执行方法,其特征在于,所述属地识别模块包括域名提取单元、策略管理单元和属地识别单元;在S3中,具体包括以下步骤:S31、将分段矩阵传送至域名提取单元;S32、对分段矩阵中元素提取有效的数据,采用所述域名提取单元对数据按照粒度从细到粗的顺序进行提取,并将提取到的域名放入域名池中;S33、对域名池中的域名进行统计,通过所述策略管理单元设定阈值,如果用户上传的总数据量达到阈值,则批量调用所述属地识别单元,如果未达到阈值,则单个调用所述属地识别单元;S34、所述属地识别单元根据提取到的域名获取对应的属地信息。5.根据权利要求4所述的一种数据智能识别分发执行方法,其特征在于,所述域名管理模块包括缓存管理单元、数据库管理单元、备案地查询单元和地域显示单元;在S32中,具体包括以下步骤:S321、调用所述缓存管理单元识别当前缓存库中是否有与所述数据对应的地域信息,若未发现地域信息,则调用所述数据库管理单元识别当前数据库中是否有与所述数据对应的地域信息;若仍未发现,则调用备案地查询单元通过备案地查询网站进行识别与所述数据对应的地域信息,并将查询到的地域信息新建至所述数据库和所述缓存库;S322、根据识别到的地域信息和用户手动新增的地域信息发送至所述地域显示单元显示,所述地域信息包括域名、属地和/或网站。6.根据权利要求1所述的一种数据智能识别分发执行方法,其特征在于,所述数据分发模块包括数据分发单元、异常检测单元和重复性检测单元;在S4中,具体包括以下步骤:S41、所述分发单元对所述识别结果进行分发;S42、所述异常检测单元实时对分发过程进行检测,若检测到属地信息为空或属地不在
接收地列表中,则标...
【专利技术属性】
技术研发人员:王海洋,张仰曼,吴琼,王丽萍,周启荣,柯枫,隋明爽,宋吉锋,
申请(专利权)人:烟台中科网络技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。