【技术实现步骤摘要】
一种对工业产品的大数据进行筛选的方法及系统
本专利技术涉及大数据
,尤其涉及一种对工业产品的大数据进行筛选的方法及系统。
技术介绍
随着经济的发展,工业产品在生产生活中的使用越来越广泛,工业主要是指原料采集与产品加工制造的产业或者工程,工业是唯一生产现代化劳动手段的部门,它决定着国民经济现代化的速度、规模和水平,在当代世界各国国民经济中起着主导作用。工业大数据是互联网,大数据和工业产业结合的产物,同时又反作用于产业升级发展。对于制造业而言,了解行业大数据产生的背景,归纳行业大数据的分类和特点,从数据流推动本身价值创造的视角看待、重造工业价值流程;对于购买用户而言,通过检索可以明确得到更准确满足需求的产品推荐,将具有现实意义。
技术实现思路
本专利技术针对现有技术中存在的技术问题,提供一种对工业产品的大数据进行筛选的方法及系统,解决现有技术中工业产品大数据数据量大的问题。跟据本专利技术的第一方面,提供了一种对工业产品的大数据进行筛选的方法,包括:步骤1,按照数据来源对数据进行预 ...
【技术保护点】
1.一种对工业产品的大数据进行筛选的方法,其特征在于,所述方法包括:/n步骤1,按照数据来源对数据进行预分类后得到第一分类数据,对所述第一分类数据进行数据抓取和语法拆分;/n步骤2,建立各个预分类下关键词信息的匹配分类规则,对所述第一分类数据按照其对应的所述匹配分类规则进行关键词提取并匹配后分类得到第二分类数据;/n步骤3,建立用户与所述第二分类数据的匹配特征数据,基于用户的匹配特征数据和搜索数据进行数据推送。/n
【技术特征摘要】
1.一种对工业产品的大数据进行筛选的方法,其特征在于,所述方法包括:
步骤1,按照数据来源对数据进行预分类后得到第一分类数据,对所述第一分类数据进行数据抓取和语法拆分;
步骤2,建立各个预分类下关键词信息的匹配分类规则,对所述第一分类数据按照其对应的所述匹配分类规则进行关键词提取并匹配后分类得到第二分类数据;
步骤3,建立用户与所述第二分类数据的匹配特征数据,基于用户的匹配特征数据和搜索数据进行数据推送。
2.根据权利要求1所述的方法,其特征在于,所述第一分类数据包括:交易平台、工业产品制造商和供应商;
所述交易平台的第二分类数据包括:工业产品营销数据、用户行为数据、用户属性数据和商品数据;
所述工业产品制造商的第二分类数据包括:原材料采购数据、原材料损耗数据、生产设备采购数据、生产设备损耗数据和商品数据;
所述供应商的第二分类数据包括:原材料出售数据和生产设备出售数据。
3.根据权利要求1所述的方法,其特征在于,所述步骤1还包括:根据布隆过滤器、相似度聚合以及分类海明距离判断抓取的数据内容是否重复,删除重复的数据内容。
4.根据权利要求2所述的方法,其特征在于,所述步骤2中进行关键词提取并匹配的过程中,数据与至少两个的关键词均匹配时,该数据分类到该至少两个的第二分类数据中;所述步骤2还包括:按照用户数据、产品数据、原料数据进行数据归类,其中,所述用户数据包括:用户行为数据和用户属性数据,所述产品数据包括:商品数据;所述原料数据包括:原材料采购数据、原材料损耗数据、生产设备采购数据、生产设备损耗数据、原材料出售数据...
【专利技术属性】
技术研发人员:周显敬,肖凌,刘虎,汪寒雨,
申请(专利权)人:武汉卓尔信息科技有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。