当前位置: 首页 > 专利查询>孙贤志专利>正文

基于大数据信息管理方法及系统技术方案

技术编号:33711706 阅读:9 留言:0更新日期:2022-06-06 08:46
一种基于大数据的信息管理方法,其特征在于,包括:步骤s1,当系统接收到信息时,信息采集模块采集该信息并将其输送至信息识别模块,信息识别模块进行识别以判定种类;步骤s2,信息识别模块识别种类并判定,存在多种类时,检测其特征并二次判定;步骤s3,当完成种类的判定时,信息识别模块识别内容以对其领域进行判定并输送至数据库;步骤s4,当中控模块对领域判定时,若无法判定则为加密信息、检索前缀和秘钥,若有则解密并判定领域且将其输送至数据库;若无则中控模块获取秘钥进行解密,若云端无秘钥,将该信息输送至综合数据库内,若有则解密并判定领域;步骤s5,若中控模块无法通过前缀信息对领域进行判定即将其输送至加密综合数据库。合数据库。合数据库。

【技术实现步骤摘要】
基于大数据信息管理方法及系统


[0001]本专利技术涉及数据识别统计管理
,尤其涉及一种基于大数据信息管理方法及系统。

技术介绍

[0002]随着信息化建设的不断发展,大数据建设工作的不断推进,许多系统积累了大量数据资源,数据的价值挖掘需求越来越大。而现有的数据管理模式已不能有效支撑海量数据价值挖掘和利用的需求,数据管理能力亟待提高。目前,数据资产不透明,难以做到“心中有数”,难以解答企业有什么数据、数据在哪里、存量流量如何等问题,数据成为一本糊涂账。缺乏对海量数据从产生、存储、处理到使用的全过程管理手段,数据状况难以掌握,从而造成数据共享难度大、数据可信度不高、数据价值挖掘困难等一系列问题。同时,海量的业务数据仅靠人工或文档的形式管理,数据管理工作量和难度越来越大,管理能力明显不足,导致决策者不能知晓资产概况,管理者不能知晓数据资产的健康度,运维者不能知晓数据资产关系。
[0003]因此,迫切需要实现数据的信息化管理,提升数据的高效、有序、透明化管理水平和利用水平,为企业的经营决策提供便捷的、准确的、可信任的数据支撑。
[0004]中国专利公开号:CN108346023A。公开了一种大数据信息管理系统。由此可见,存在以下问题:数据管理难度大、数据可信度不高、数据挖掘困难。

技术实现思路

[0005]为此,本专利技术提供一种基于大数据信息管理方法及系统,用以克服现有技术中数据管理难度大、数据可信度不高、数据挖掘困难的问题。
[0006]一方面,本专利技术提供一种基于大数据的信息管理方法,包括:步骤s1,当系统接收到信息时,中控模块控制信息采集模块采集该信息并将信息输送至信息识别模块,信息识别模块对信息进行识别以判定信息的种类;步骤s2,所述中控模块控制所述信息识别模块识别信息中信息特征的种类以对信息的种类进行初步判定,当信息中存在多个不同种类的信息特征时,信息识别模块检测各种类的信息特征的占比以对信息的种类进行二次判定;信息的种类包括文本信息、图像信息和代码信息;步骤s3,当所述中控模块完成对信息的种类的判定时,中控模块控制所述信息识别模块识别信息中的内容以对信息所属领域进行判定并在完成判定时将信息输送至对应的公开领域数据库;步骤s4,当所述中控模块对代码信息所属的领域进行判定时,若中控模块无法对信息的领域进行判定,中控模块判定该信息为加密信息、检索信息中的前缀数据并检索该信息是否附带有用以解密前缀信息的秘钥,若中控模块检索到秘钥,中控模块对前缀数据进行解密、根据解密后的前缀信息中的内容判定该代码信息所属领域并在判定完成后将该
代码信息输送至对应的加密领域数据库;若中控模块未检索到秘钥,中控模块从云端数据库获取秘钥以对前缀信息进行解密,若云端数据库中不存在能够解密前缀信息的秘钥,中控模块判定无法对该信息进行领域划分并将该信息输送至综合存储模块中的加密综合数据库内,若云端数据库中存在能够解密前缀信息的秘钥,中控模块使用该秘钥解密前缀信息并根据解密后的前缀信息中的内容判定该代码信息所属领域;步骤s5,若中控模块无法通过解密后的前缀信息对所述代码信息所属的领域进行判定,中控模块将该信息输送至综合存储模块中的加密综合数据库内。
[0007]进一步地,当所述中控模块对信息的种类进行判定时,中控模块控制所述识别模块识别信息中存在的特征的种类数N并根据N对信息的种类进行初步判定,所述中控模块中设有预设文字特征和预设图像特征,若N=1,中控模块将信息的种类判定为识别模块识别到的特征所属种类,若N>1,中控模块根据识别模块识别到的特征所属种类对信息的种类进行进一步判定,若N=0,中控模块提取控制识别的特征并以该特征作为依据检索云端数据库,若云端数据库中不存在针对信息中的各特征的判定结果,中控模块将该信息判定为异常信息并将该信息输送至异常数据库,若云端数据库中存在若干针对信息中的各特征的判定结果,中控模块根据云端数据库中判定的特征所属种类的数量对信息的种类进行确定。
[0008]进一步地,当所述中控模块判定信息中存在的特征的种类数N=1时,若所述识别模块识别到的特征为图像特征,中控模块初步判定该信息为图像信息并针对该信息属于相片或图表进行进一步判定;若所述识别模块识别到的特征为文字特征,所述中控模块初步判定该信息为文本信息并针对该信息中的内容为文字或代码进行进一步判定。
[0009]进一步地,当所述中控模块针对图像信息属于相片或图表进行进一步判定时,中控模块控制识别模块识别信息中的轮廓特征,并检测该轮廓特征与周边区域的色度差值

C以对图像信息的种类进行判定,所述中控模块中设有第一预设色度差值

C1和第二预设色度差值

C2,其中,

C1<

C2,若

C≤

C1,所述中控模块判定针对轮廓线出现误判并控制所述识别模块重新检测图像信息中的轮廓线;若

C1<

C≤

C2,所述中控模块判定所述图像信息为相片;若

C>

C2,所述中控模块判定所述图像信息为图表。
[0010]进一步地,当所述中控模块针对文本信息中的内容为文字或代码进行进一步判定时,中控模块控制识别模块识别信息中汉字数量的占比Ba、字母数量的占比Bb和符号数量的占比Bc并根据Ba、Bb和Bc对文本信息的种类进行判定,所述中控模块中设有预设本文占比标准B0,设定0.5<B0<0.7;若Ba>B0,所述中控模块判定所述文本信息的内容为文字并控制所述识别模块识别该信息中的词语以判定该信息所属领域;若Bb>B0,所述中控模块初步判定所述文本信息的内容为代码并控制所述识别模块重新识别该信息中是否存在具有实际含义的汉字或词语,若识别模块测得该信息中具备实际含义的汉字或词语与该信息中汉字总数的比例低于45%,中控模块判定该文本信息的内容为代码,若识别模块测得该信息中具备实际含义的汉字或词语与该信息中汉字总数的比例大于等于45%,中控模块判定该文本信息为外文文本控制所述识别模块识别该信息中的词语以判定该信息所属领域;
若Bc>B0,所述中控模块将Ba与Bb进行比对,若Ba≤Bb,中控模块判定该文本信息的内容为代码,若Ba>Bb,中控模块判定该文本信息的内容为文字并控制所述识别模块识别该信息中的词语以判定该信息所属领域。
[0011]进一步地,当所述中控模块判定信息中存在的特征的种类数N>1时,中控模块检测信息所占字符并分别检测中文字特征的面积占比Sa和图像特征的面积占比Sb,若Sa>3
×
Sb,所述中控模块判定该信息为带有附图说明的文本信息并控制所述识别模块识别该信息中的词语以判定该信息所属领域;若Sb>9
×
Sa,所述中控模块判定该信息为带有文字说明的图像信息并控制所述识别模块针对信息中的图像特征属于相片或图表进行进一步判定。
[0012]进一步地,当所述中控模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的信息管理方法,其特征在于,包括:步骤s1,当系统接收到信息时,中控模块控制信息采集模块采集该信息并将信息输送至信息识别模块,信息识别模块对信息进行识别以判定信息的种类;步骤s2,所述中控模块控制所述信息识别模块识别信息中信息特征的种类以对信息的种类进行初步判定,当信息中存在多个不同种类的信息特征时,信息识别模块检测各种类的信息特征的占比以对信息的种类进行二次判定;信息的种类包括文本信息、图像信息和代码信息;步骤s3,当所述中控模块完成对信息的种类的判定时,中控模块控制所述信息识别模块识别信息中的内容以对信息所属领域进行判定并在完成判定时将信息输送至对应的公开领域数据库;步骤s4,当所述中控模块对代码信息所属的领域进行判定时,若中控模块无法对信息的领域进行判定,中控模块判定该信息为加密信息、检索信息中的前缀数据并检索该信息是否附带有用以解密前缀信息的秘钥,若中控模块检索到秘钥,中控模块对前缀数据进行解密、根据解密后的前缀信息中的内容判定该代码信息所属领域并在判定完成后将该代码信息输送至对应的加密领域数据库;若中控模块未检索到秘钥,中控模块从云端数据库获取秘钥以对前缀信息进行解密,若云端数据库中不存在能够解密前缀信息的秘钥,中控模块判定无法对该信息进行领域划分并将该信息输送至综合存储模块中的加密综合数据库内,若云端数据库中存在能够解密前缀信息的秘钥,中控模块使用该秘钥解密前缀信息并根据解密后的前缀信息中的内容判定该代码信息所属领域;步骤s5,若中控模块无法通过解密后的前缀信息对所述代码信息所属的领域进行判定,中控模块将该信息输送至综合存储模块中的加密综合数据库内。2.根据权利要求1所述的基于大数据的信息管理方法,其特征在于,当所述中控模块对信息的种类进行判定时,中控模块控制所述识别模块识别信息中存在的特征的种类数N并根据N对信息的种类进行初步判定,所述中控模块中设有预设文字特征和预设图像特征,若N=1,中控模块将信息的种类判定为识别模块识别到的特征所属种类,若N>1,中控模块根据识别模块识别到的特征所属种类对信息的种类进行进一步判定,若N=0,中控模块提取控制识别的特征并以该特征作为依据检索云端数据库,若云端数据库中不存在针对信息中的各特征的判定结果,中控模块将该信息判定为异常信息并将该信息输送至异常数据库,若云端数据库中存在若干针对信息中的各特征的判定结果,中控模块根据云端数据库中判定的特征所属种类的数量对信息的种类进行确定。3.根据权利要求2所述的基于大数据的信息管理方法,其特征在于,当所述中控模块判定信息中存在的特征的种类数N=1时,若所述识别模块识别到的特征为图像特征,中控模块初步判定该信息为图像信息并针对该信息属于相片或图表进行进一步判定;若所述识别模块识别到的特征为文字特征,所述中控模块初步判定该信息为文本信息并针对该信息中的内容为文字或代码进行进一步判定。4.根据权利要求3所述的基于大数据的信息管理方法,其特征在于,当所述中控模块针对图像信息属于相片或图表进行进一步判定时,中控模块控制识别模块识别信息中的轮廓特征,并检测该轮廓特征与周边区域的色度差值

C以对图像信息的种类进行判定,所述中控模块中设有第一预设色度差值

C1和第二预设色度差值

C2,其中,

C1<

C2,


C≤

C1,所述中控模块判定针对轮廓线出现误判并控制所述识别模块重新检测图像信息中的轮廓线;若

C1<

C≤

C2,所述中控模块判定所述图像信息为相片;若

C>

C2,所述中控模块判定所述图像信息为图表。5.根据权利要求4所述的基于大数据的信息管理方法,其特征在于,当所述中控模块针对文本信息中的内容为文字或代码进行进一步判定时,中控模块控制识别模块识别信息中汉字数量的占比Ba、字母数量的占比Bb和符号数量的占比Bc并根据Ba、Bb和Bc对文本信息的种类进行判定,所述中控模块中设有预设本文占...

【专利技术属性】
技术研发人员:孙贤志
申请(专利权)人:孙贤志
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1