【技术实现步骤摘要】
数据存储系统及方法
本专利技术涉及计算机
,尤其是涉及一种数据存储系统及方法。
技术介绍
随着新型互联网的兴起,传统的关系数据库在应付所见即所得的高体验网站,特别是超大规模和高并发的社交网络服务类型的纯动态网站已经显得力不从心,暴露了很多难以克服的问题。以能源行业为例,由于能源公司信息读写频率较高,且能源公司分类统计、地区归类运算量大;用户在前端进行信息时要求的查询速度快;用户行为日志记录量频繁,系统推送能源服务频率较高。对于能源行业而言,通常采用传统关系数据库进行数据的存储,能源行业信息通过爬虫手段所获取的数据的数据结构不稳定性,无法支持快速回应用户的查询需求,且面对大量的数据种类和快速的读写频率,传统的关系数据库无法很好地支持数据库中数据信息的更迭,容易出现数据库运行迟缓等问题。采用传统的关系数据库进行能源信息的存储,用户在对信息进行查询时,回应速度慢,用户体验感差。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种数据存储系统及方法,以缓解了传统关系数据库无法很好地处理海量数据的检索、读写响应速度慢的技术问题。第一方面,本专利技术实施例提供了一种数据存储系统,该系统包括数据模块,以及与数据模块通信连接的预测模块、执行模块和监测模块;数据模块按照预先设定的数据获取原则,从数据信息端读取与数据获取原则相对应的数据,并按照预设数据处理原则,对获取的数据进行分片存储;其中,数据获取原则包括期望获取的行业信息,数据信息端包括公开网页,数据处理原则至少包括应用场景划分处理原则;预测模块用于根据预设数据挖掘算法,对数据模块分片存储的数据进行数据预分析,并将生 ...
【技术保护点】
1.一种数据存储系统,其特征在于,所述系统包括数据模块,以及与所述数据模块通信连接的预测模块、执行模块和监测模块;所述数据模块按照预先设定的数据获取原则,从数据信息端读取与所述数据获取原则相对应的数据,并按照预设数据处理原则,对获取的数据进行分片存储;其中,所述数据获取原则包括期望获取的行业信息,所述数据信息端包括公开网页,所述数据处理原则至少包括应用场景划分处理原则;所述预测模块用于根据预设数据挖掘算法,对所述数据模块分片存储的数据进行数据预分析,并将生成的数据分析报告与预分析的数据进行关联存储;其中,所述数据预分析包括数据汇总、数据提炼和数据挖掘;所述执行模块用于接收外部终端发出的搜索命令,根据所述搜索命令生成搜索日志,以记录所述外部终端的搜索操作,并按照预设命令执行依据,将所述搜索命令进行分解,以获得分步后的搜索命令,并根据所述分步后的搜索命令在所述数据模块分片存储的所述数据中搜索与所述搜索命令匹配的需求数据及所述需求数据关联的数据分析报告;以及,将所述需求数据发送至所述外部终端;所述监测模块用于监测所述系统的运行状态,并按照预设的时间周期生成的所述系统的运行日志;所述数据模块还 ...
【技术特征摘要】
1.一种数据存储系统,其特征在于,所述系统包括数据模块,以及与所述数据模块通信连接的预测模块、执行模块和监测模块;所述数据模块按照预先设定的数据获取原则,从数据信息端读取与所述数据获取原则相对应的数据,并按照预设数据处理原则,对获取的数据进行分片存储;其中,所述数据获取原则包括期望获取的行业信息,所述数据信息端包括公开网页,所述数据处理原则至少包括应用场景划分处理原则;所述预测模块用于根据预设数据挖掘算法,对所述数据模块分片存储的数据进行数据预分析,并将生成的数据分析报告与预分析的数据进行关联存储;其中,所述数据预分析包括数据汇总、数据提炼和数据挖掘;所述执行模块用于接收外部终端发出的搜索命令,根据所述搜索命令生成搜索日志,以记录所述外部终端的搜索操作,并按照预设命令执行依据,将所述搜索命令进行分解,以获得分步后的搜索命令,并根据所述分步后的搜索命令在所述数据模块分片存储的所述数据中搜索与所述搜索命令匹配的需求数据及所述需求数据关联的数据分析报告;以及,将所述需求数据发送至所述外部终端;所述监测模块用于监测所述系统的运行状态,并按照预设的时间周期生成的所述系统的运行日志;所述数据模块还用于当所述数据模块分片存储的数据所占空间达到预设数据存储空间占比时,所述数据模块按照预设的删除原则,对所述数据模块分片存储的数据进行清理,以释放所述数据模块的存储空间。2.根据权利要求1所述的系统,其特征在于,所述数据模块包括数据处理单元;所述数据处理单元用于根据所述数据处理原则将所述数据模块获取的数据进行应用场景分片存储。3.根据权利要求1所述的系统,其特征在于,所述执行模块包括多个执行单元;所述执行模块用于将所述分步后的搜索命令分配至一个或多个空闲状态下的执行单元;所述空闲状态下的执行单元用于执行分步处理后的搜索命令。4.根据权利要求1所述的系统,其特征在于,所述系统还包括关联模块;所述关联模块用于提取所述数据模块中的所述数据的关联词,将所述数据与所述关联词进行关联存储;以及,将所述关联词和所述数据发送至所述数据模块,其中,所述关联词至少包括以下分类的一种:所述数据的行业分类、领域分类、产品分类;所述数据模块还用于将携带所述关联词的所述数据存储至所述关联词匹配的存储区。5.根据权利要求4所述的系统,其特征在于,所述搜索命令包括关联词搜索命令;所述执行模块还用于根据所述关联词搜索命令,在所述关联词匹配的存储区中搜索与所述搜索命令匹配的需求数据。6.根据权利要求4所述的系统,其特征在于,所述数据模块包括多个集合单元;每个所述集合单元均配置有关联词对应的标识,用于对携带所述关联词的所述数据进行压缩存...
【专利技术属性】
技术研发人员:彭磊,许庆,朱伟凯,韩雪,
申请(专利权)人:上海泰豪迈能能源科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。