本发明专利技术涉及大数据分类技术领域,且公开了大数据分类系统,包括数据分类系统,所述数据分类系统包括采集单元、传输单元、分析单元、预处理单元、处理单元、展示单元和大数据库,本发明专利技术通过分析单元对输入的内容进行充分掌握,然后通过预处理单元对输入的内容进行分解,得到不同分解区间内信息的具体含义,再将分析单元得出的信息内容和分解得到的信息内容进行整合对比,得出两者件重合度最大的信息内容区间,并以此为根据进行搜索和提取,得出用户想要的内容,便于用户查找到目标数据类群,提高用户输入数据和目标数据类群的一致度,即将大数据信息分成用户需要的数据种类,提高分类的内容与用户查找的内容的一致度。内容与用户查找的内容的一致度。内容与用户查找的内容的一致度。
【技术实现步骤摘要】
大数据分类方法及系统
[0001]本专利技术涉及大数据分类
,具体为大数据分类方法及系统。
技术介绍
[0002]大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的资讯,随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
[0003]知识产权,是“基于创造成果和工商标记依法产生的权利的统称”。最主要的三种知识产权是著作权、专利权和商标权,其中专利权与商标权也被统称为工业产权。也被翻译为智力成果权、智慧财产权或智力财产权,专利,从字面上是指专有的权利和利益。专利在现代一般是由政府机关或者代表若干国家的区域性组织,根据申请而颁发的一种文件,这种文件记载了专利技术创造的内容,并且在一定时期内产生这样一种法律状态,即获得专利的专利技术创造在一般情况下他人只有经专利权人许可才能予以实施。
[0004]知识产权的专利数量较多,现有的知识产权专利分类方法和系统在使用时,用户大量根据自己输入的内容和找到的目标专利类群一致度较低,存在一定缺陷,且解决上述问题,提出大数据分类方法及系统。
技术实现思路
[0005]本专利技术提供如下技术方案:大数据分类系统,包括数据分类系统,所述数据分类系统包括采集单元、传输单元、分析单元、预处理单元、处理单元、展示单元和大数据库,采集单元的输出端与传输单元的输入端连接,传输单元的输出端与分析单元的输入端连接,分析单元的输出端与预处理单元的输入端连接,预处理单元的输出端与处理单元的输入端连接,处理单元的输出端与展示单元的输入端连接,大数据库的输出端与处理单元的输入端连接。
[0006]通过采用上述技术方案;通过分析单元对用户输入的内容尽心深层次的剖析,从而对输入的内容进行充分掌握,然后通过预处理单元对输入的内容进行分解,得到不同分解区间内信息的具体含义,再将分析单元得出的信息内容和分解得到的信息内容进行整合对比,得出两者件重合度最大的信息内容区间,从而作为用户输入内容的最终表达内容,并以此为根据进行搜索和提取,得出用户想要的内容,便于用户查找到目标数据类群,提高用户输入数据和目标数据类群的一致度,即将大数据信息分成用户需要的数据种类,提高分类的内容与用户查找的内容的一致度。
[0007]优选的,所述采集单元包括输入模块,采集单元用于通过输入模块供用户输入要查找的信息关键词,为第一信息。
[0008]通过采用上述技术方案;输入设备可以为语言和文字的输入形式进行输入,便于用户实际使用,通过采集单元采集用户输入的内容,便于进行后续操作。
[0009]优选的,所述传输单元包括无线传输和有线传输,传输单元用于通过无线传输和有线传输对输入的信息进行传输,无线传输包括无线局域网和数据网络等。
[0010]通过采用上述技术方案;通过无线和有线的方式对采集的信息进行传输,保证信息传输的多样性,且保证信息传输的稳定性和效率。
[0011]优选的,所述分析单元包括信息剖析,分析单元用于通过信息剖析对输入的信息进行语法和语义的剖析,得到第一信息的深层次信息,为第二信息。
[0012]通过采用上述技术方案;通过分析单元便于得出用户输入内容的深层次含义,方便明确用户的目标数据类群,便于后续根据深层次数据信息内容进行搜索和提取。
[0013]优选的,所述预处理单元包括信息分解、信息整合和信息对比,信息分解用于对第一信息进行分解,得到分解后的各信息含义,信息整合用于将信息分解后的信息与第二信息进行整合,得到整合后的信息数据,并对信息分解后的信息与第二信息进行对比,得到对比的信息数据,整合对比完成的信息为第三信息。
[0014]通过采用上述技术方案;通过预处理单元对第一信息进行分解处理,通过对第一信息的各个内容进行逐个剖析,深度理解用户的目标含义,并通过将其内容与分析单元分析后的内容,即第二信息进行整合和对比,得出其重合的信息内容,很大程度掌握用户表达的含义,从而提高用户输入信息数据与目标信息数据的一致性,即将大数据信息分成用户需要的数据种类。
[0015]优选的,所述处理单元包括信息搜索和信息提取,信息搜索用于根据得出的第三信息在大数据库内进行指定内容搜索,查找得出与第三信息相关的大数据信息,信息提取用于将查找得出与第三信息相关的大数据信息从大数据库内提取出来,供用户实际使用。
[0016]通过采用上述技术方案;通过处理单元便于根据第三信息在大数据库内进行搜索,得到用户的目标数据种类和具体信息,并将其提取出来,供用户尽心实际使用。
[0017]优选的,所述展示单元包括信息展示,信息展示用于对处理单元提取的展示。
[0018]通过采用上述技术方案;通过展示单元便于用户阅读处理单元搜索、提取出来的数据信息,方便用户使用。
[0019]优选的,所述大数据库用于提供基础源数据。
[0020]通过采用上述技术方案;便于存储多类和大量知识产权专利信息,为用户分类查找提供源数据信息。
[0021]优选的,大数据分类方法适用于权利要求1
‑
8任一项的大数据分类系统,包括以下主要步骤;
[0022]S1:通过采集单元对用户输入的信息进行采集,为第一信息;
[0023]S2:采集完成后,将采集的信息通过传输单元进行无线传输或有线传输;
[0024]S3:分析单元接收到传输的信息后对信息进行剖析,深层次明确信息表达的内容,为第二信息;
[0025]S4:分析完成后,预处理单元对对第一信息进行分解,明确分解后的信息内容,并将明确的信息内容与第二信息进行整合和对比,得到整合和对比后的信息,为第三信息;
[0026]S5:处理单元接收到第三信息后,根据第三信息在大数据库内进行搜索,并提取与
第三信息相关的信息;
[0027]S6:信息提取完成后,对提取的信息进行展示。
[0028]有益效果
[0029]与现有技术相比,本专利技术提供了大数据分类方法及系统,具备以下有益效果:
[0030]本专利技术通过分析单元对用户输入的内容尽心深层次的剖析,从而对输入的内容进行充分掌握,然后通过预处理单元对输入的内容进行分解,得到不同分解区间内信息的具体含义,再将分析单元得出的信息内容和分解得到的信息内容进行整合对比,得出两者件重合度最大的信息内容区间,从而作为用户输入内容的最终表达内容,并以此为根据进行搜索和提取,得出用户想要的内容,便于用户查找到目标数据类群,提高用户输入数据和目标数据类群的一致度,即将大数据信息分成用户需要的数据种类,提高分类的内容与用户查找的内容的一致度。
附图说明
[0031]本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.大数据分类系统,包括数据分类系统,其特征在于:所述数据分类系统包括采集单元、传输单元、分析单元、预处理单元、处理单元、展示单元和大数据库,采集单元的输出端与传输单元的输入端连接,传输单元的输出端与分析单元的输入端连接,分析单元的输出端与预处理单元的输入端连接,预处理单元的输出端与处理单元的输入端连接,处理单元的输出端与展示单元的输入端连接,大数据库的输出端与处理单元的输入端连接。2.根据权利要求1所述的大数据分类系统,其特征在于:所述采集单元包括输入模块,采集单元用于通过输入模块供用户输入要查找的信息关键词,为第一信息。3.根据权利要求1所述的大数据分类系统,其特征在于:所述传输单元包括无线传输和有线传输,传输单元用于通过无线传输和有线传输对输入的信息进行传输,无线传输包括无线局域网和数据网络等。4.根据权利要求1所述的大数据分类系统,其特征在于:所述分析单元包括信息剖析,分析单元用于通过信息剖析对输入的信息进行语法和语义的剖析,得到第一信息的深层次信息,为第二信息。5.根据权利要求1所述的大数据分类方系统,其特征在于:所述预处理单元包括信息分解、信息整合和信息对比,信息分解用于对第一信息进行分解,得到分解后的各信息含义,信息整合用于将信息分解后的信息与第二信息进行整合,得到整合后的信息数据,并对信息分解后的信息与第二信息进行对...
【专利技术属性】
技术研发人员:余文香,
申请(专利权)人:重庆香海科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。