本发明专利技术公开了一种节约数据库存储空间的方法和系统,该方法包括以下步骤:从商品信息中,提取出标准属性单元,建立标准属性单元库;计算所述标准属性单元库中的标准属性单元,生成标准属性单元序列化文件,定期推送所述标准属性单元序列化文件;判断新发布商品和所述标准属性单元序列化文件中的标准属性单元是否匹配,如果是,绑定所述新发布商品和所述匹配的标准属性单元。在具体实现中,采用该方法能够有效地节约存储的空间,减少网络流量。
【技术实现步骤摘要】
本专利技术涉及计算机网络
,特别涉及一种节约数据库存储空间的 方法和系统。
技术介绍
随着计算机网络技术的发展,网上购物蓬勃发展,出现了很多购物类网 站,人们只需在购物网站上注册,将商品信息传递到网上就可以足不出户的 进行交易。例如,目前购物网站淘宝网有1.8亿商品,当有卖家发布商品时,每件商 品都对应了名称、图片、简介说明、价格区间和相关属性,因此,这些商品 的数据存在大量的冗余。比如诺基亚的N73,现在是每个N73商品都会对应各 自卖家发布的图片、简介说明、属性等内容。这就使得购物网的数据库需要 大量的存储空间,现在购物网使用的多数是产品库,需要运营人工维护大量 的产品。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题 现有技术中使用的是产品库,需要运营人工维护大量的产品,不够灵活。 每件商品都对应了名称、图片、简介说明、价格区间和相关属性,在这些商 品的数据存在大量的冗余,对商品进行规范不方便;同时,随着网站的发展, 产品数量迅速增长,增加了运营人员的困难。
技术实现思路
本专利技术实施例提供一种节约数据库存储空间的方法和系统,通过使用数 据仓库的挖掘算法,对后台类目下同类属性商品聚合分析,提取出标准属性 单元,减少数据库的存储空间和图片在网络上的传输流量,解决了运营困难 的问题。5节约数据库存储空间 的方法,包括以下步骤从商品信息中,提取出标准属性单元,建立标准属性单元库; 计算所述标准属性单元库中的标准属性单元,生成标准属性单元序列化文件,定期推送所述标准属性单元序列化文件;判断新发布商品和所迷标准属性单元序列化文件是否匹配,如杲是,绑 定所述新发布商品和所匹配到的标准属性单元。本专利技术实施例另一方面提供了一种节约数据库存储空间的系统,包括数据库,用于存储商品信息和正式的标准属性单元;标准属性单元服务器,用于緩存来自所述数据库和后台服务器的数据, 包括来自所述数据库的正式的标准属性单元和商品属性及来自所述后台服务 器的正式的标准属性单元,计算正式的标准属性单元,生成标准属性单元序 列化文件;后台服务器,用于根据来自所述标准属性单元服务器的商品信息,生成 正式的标准属性单元;前台服务器,用于接收来自所述标准属性单元服务器的标准属性单元序 列化文件,匹配商品和所匹配到的标准属性单元。与现有技术相比,本专利技术实施例具有以下优点本专利技术实施例通过引入标准属性单元表示商品的共同属性,如果所发布 商品可以匹配到序列化文件中的标准属性单元,则绑定商品和匹配的序列化 文件中的标准属性单元,这样既可以节约存储,便于规范商品;还可以通过 使用标准属性单元的图片来节省图片存储的空间,减少存储开销及网络流量。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发 明的一些实施例,对于本领域普通技术人员来"i并,在不付出创造性劳动的前 提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一的一种节约数据库存储空间的方法流程图2是本专利技术实施例二的一种节约数据库存储空间的方法流程图; 图3是本专利技术实施例三的一种节约数据库存储空间的方法流程图; 图4是本专利技术实施例四的一种节约数据库存储空间的方法流程图; 图5是本专利技术实施例五的一种节约数据库存储空间的系统结构图; 图6是本专利技术实施例五中数据库的具体结构图; 图7是本专利技术实施例五中标准属性单元服务器的具体结构图; 图8是本专利技术实施例五中后台服务器的具体结构图; 图9是本专利技术实施例五中前台服务器的具体结构图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例, 而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有 做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例一提供了一种节约数据库存储空间的方法,如图l所示,包 括以下步骤步骤S101,从商品信息中,提取出正式的SPU (Standard Property Unit, 标准属性单元),建立SPU库。利用搜索引擎从商品信息中搜索出商品的关键属性,根据搜索出的商品 的关键属性,使用数据库的挖掘算法挖掘商品的共同属性,根据挖掘的商品 的共同属性,聚合分析提取出具有商品共同属性的待审核的SPU,判断审核 待审核的SPU是否为商品的共同属性,如果是,则生成正式的SPU,建立SPU 库。SPU,定义为后台标准类目叶子节点下一组共同属性的集合,具有名称、 简介、图片(可以是多个)、价格、主属性、绑定属性,并能关联其它SPU。 在众多商品中,服务器可以将具有某些相同属性的商品归类到一起,称为一 个SPU, SPU以数据表的形式存储,数据表包含该SPU的SPU—ID,并通过类目ID字段外联到类目,表示该SPU所属类目,这样,可以找到一个类目下所有的SPU。 SPU可以重复使用。步骤S102,计算SPU库中的SPU,生成SPU序列化文件,按照设定的时间 间隔,定期向前台推送SPU序列化文件。其中,SPU序列化文件是数据库中数据的集合,包含后台类目、SPU和关 联SPU等信息。例如手机诺基亚N73的SPU序列化文件中,后台类目为手机, 在该类目下可以找到一个SPU,该SPU包含品牌为诺基亚,型号为N73,操作 系统为***等信息,还可以找到关联SPU (如手机诺基亚N73的电池的SPU)。生成SPU序列化文件,具体可以为在后台类目中获取类目信息,根据得 到的类目信息通过访问SPU库获取该类目下所有的SPU,所获取的SPU生成 SPU序列化文件。步骤S103,判断新发布商品和SPU序列化文件中的SPU是否匹配,如果是, 绑定新发布商品和匹配的SPU 。具体的,绑定新发布商品和匹配的SPU为,建立新发布商品和上述的匹配 的SPU之间的对应关系,并保存该对应关系,用于后续操作。如果新发布商品可以匹配到序列化文件中的SPU,将匹配成功的SPU和该新发布的商品建立对应关系,未匹配成功的属性为商品的特有属性,保存在 属性字段中。通过本专利技术实施例的技术方案,使用数据库的挖掘算法,对后台类目下的同类属性商品提取聚合分析,把商品具有的相同特征抽取出来,引入SPU 表示商品的共同属性,如果新发布商品匹配到序列化文件中的SPU,则绑定商 品和匹配的序列化文件中的SPU,从而将网站中上亿的商品变成百万级别数量 的SPU,这样既可以节约存储,便于规范商品;还可以通过使用SPU的图片来 节省图片存储的空间,减少存储开销及网络流量。本专利技术实施例二提供了一种节约数据库存储空间的方法,如图2所示,包 括以下步骤步骤S201 ,利用搜索引擎搜索数据库中商品的关键属性。 搜索引擎搜索的是预先整理好的索引数据库。搜索引擎,指收集了上几千万到几十亿个商品属性并对商品属性中的每一个属性和属性值组合进行索 引,建立索引数据库的全文搜索引擎。当查找某个主属性的时候,所有包含 了该属性和属性值組合的商品属性都将作为搜索结果被搜出来。步骤S202,根据步骤S201搜索出的商品的关键属性,使用数据库的挖掘 算法,挖掘出商品的共同属性。DM (Data Mining,本文档来自技高网...
【技术保护点】
一种节约数据库存储空间的方法,其特征在于,包括: 从商品信息中,提取出标准属性单元,建立标准属性单元库; 计算所述标准属性单元库中的标准属性单元,生成标准属性单元序列化文件,定期推送所述标准属性单元序列化文件; 判断新发布 商品和所述标准属性单元序列化文件中的标准属性单元是否匹配,如果是,绑定所述新发布商品和所述匹配的标准属性单元。
【技术特征摘要】
【专利技术属性】
技术研发人员:岳旭强,朱晨,靳科,魏虎,骆静峰,曹灵,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:VG[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。