一种基于数据关联关系进行推送信息的方法及系统技术方案

技术编号:24331406 阅读:47 留言:0更新日期:2020-05-29 19:44
本发明专利技术公开了一种基于数据关联关系进行推送信息的方法,属于数据处理技术领域。本发明专利技术方法包括:采集用户群中每个用户的基本信息,根据用户群中每个用户的基本信息,对用户群中的用户进行相近分类,为相近的每一类用户建立相近集合;确定相似集合中的每个用户的需求的信息类型,生成订阅集合;确定任意多个信息类型的支持度;获取所述任意多个信息类型和其他信息类型的置信度;确定支持度和置信度,是否满足推送条件,若支持度和置信度同时满足最小支持度阈值概率和最小置信度阈值概率,确定任意多个信息类型为强关联信息类型,并根据任意多个信息类型,获取所述信息类型的信息数据对多个用户进行推送。本发明专利技术为用户提供所需全量数据信息。

A method and system of pushing information based on Data Association

【技术实现步骤摘要】
一种基于数据关联关系进行推送信息的方法及系统
本专利技术涉及数据处理
,并且更具体地,涉及一种基于数据关联关系进行推送信息的方法及系统。
技术介绍
粮食行业数据信息受发展技术、时间进度等因素影响,从业者或相关机构想获得有效与持续更新的信息,需要经过一定时间的人工数据搜索、甄别、购买相关服务,才能获得需要的数据。现有获得有效的粮食行业信息、数据、资料的方法有:1、搜索引擎,2、购买专业粮食行业数据服务机构定期发布的信息,3、新闻网站进行分类关注。上述方法中,免费类信息(搜索引擎、新闻网站)需要进行二次甄别才能使用。付费类信息多数是专业分析报告,用户需要的有效数据往往是报告中的一小部分。
技术实现思路
针对上述问题,一种基于数据关联关系进行推送信息的方法,包括:采集用户群中每个用户的基本信息,根据用户群中每个用户的基本信息,对用户群中的用户进行相近分类,为相近的每一类用户建立相近集合;确定相似集合中的每个用户的需求的信息类型,生成订阅集合;确定订阅集合中每个用户同时订阅任意多个信息类型的概率,确定任意两个信息类型间的关联规则,根据关联规则确定任意多个信息类型的支持度;确定订阅集合中每个用户订阅任意多个信息类型的基础上订阅其他信息类型的概率,获取所述任意多个信息类型和其他信息类型的置信度;所述任意多个信息类型与所述任意多个信息类型和其他信息类型为相同的信息类型;确定支持度和置信度,是否满足推送条件,若支持度和置信度同时满足最小支持度阈值概率和最小置信度阈值概率,确定任意多个信息类型为强关联信息类型,并根据任意多个信息类型,获取所述信息类型的信息数据对多个用户进行推送。可选的,用户基本信息,包括:用户所在区域、用户身份信息和用户所属行业。可选的,最小支持度阈值概率为0.2。可选的,最小置信度阈值概率为0.7。可选的,信息数据的获取,包括:根据信息类型,获取初步信息数据,对初步信息数据进行处理,过滤非法数据或虚假数据,生成样本数据,对样本数据进行修订,修订后进行审核,审核通过后生成信息数据。本专利技术还提出了一种基于数据关联关系进行推送信息的系统,包括:采集模块,采集用户群中每个用户的基本信息,根据用户群中每个用户的基本信息,对用户群中的用户进行相近分类,为相近的每一类用户建立相近集合;集合生成模块,确定相似集合中的每个用户的需求的信息类型,生成订阅集合;处理模块,确定订阅集合中每个用户同时订阅任意多个信息类型的概率,确定任意两个信息类型间的关联规则,根据关联规则确定任意多个信息类型的支持度,确定订阅集合中每个用户订阅任意多个信息类型的基础上订阅其他信息类型的概率,获取所述任意多个信息类型和其他信息类型的置信度;所述任意多个信息类型与所述任意多个信息类型和其他信息类型为相同的信息类型;推送模块,确定支持度和置信度,是否满足推送条件,若支持度和置信度同时满足最小支持度阈值概率和最小置信度阈值概率,确定任意多个信息类型为强关联信息类型,并根据任意多个信息类型,获取所述信息类型的信息数据对多个用户进行推送。可选的,用户基本信息,包括:用户所在区域、用户身份信息和用户所属行业。可选的,最小支持度阈值概率为0.2。可选的,最小置信度阈值概率为0.7。可选的,信息数据的获取,包括:根据信息类型,获取初步信息数据,对初步信息数据进行处理,过滤非法数据或虚假数据,生成样本数据,对样本数据进行修订,修订后进行审核,审核通过后生成信息数据。本专利技术利用数据抓取,使得细分领域数据详尽,用户能一目了然掌握所需全量数据信息,在更短的时间得到需求的数据,数据直接在不同专题中进行整理展示,更加有效的汇总了不同类型的数据,为从业者省去了再次甄别不同类型数据、报告、资讯的时间。附图说明图1为本专利技术一种基于数据关联关系进行推送信息的方法流程图;图2为本专利技术一种基于数据关联关系进行推送信息的系统结构图。具体实施方式现在参考附图介绍本专利技术的示例性实施方式,然而,本专利技术可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本专利技术,并且向所属
的技术人员充分传达本专利技术的范围。对于表示在附图中的示例性实施方式中的术语并不是对本专利技术的限定。在附图中,相同的单元/元件使用相同的附图标记。除非另有说明,此处使用的术语(包括科技术语)对所属
的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。本专利技术一种基于数据关联关系进行推送信息的方法,如图1所示,包括:采集用户群中每个用户的基本信息,根据用户群中每个用户的基本信息,对用户群中的用户进行相近分类,为相近的每一类用户建立相近集合;用户基本信息,包括:用户所在区域、用户身份信息和用户所属行业。确定相似集合中的每个用户的需求的信息类型,生成订阅集合;确定订阅集合中每个用户同时订阅任意多个信息类型的概率,确定任意两个信息类型间的关联规则,根据关联规则确定任意多个信息类型的支持度;确定订阅集合中每个用户订阅任意多个信息类型的基础上订阅其他信息类型的概率,获取所述任意多个信息类型和其他信息类型的置信度;所述任意多个信息类型与所述任意多个信息类型和其他信息类型为相同的信息类型;最小支持度阈值概率为0.2。最小置信度阈值概率为0.7。确定支持度和置信度,是否满足推送条件,若支持度和置信度同时满足最小支持度阈值概率和最小置信度阈值概率,确定任意多个信息类型为强关联信息类型,并根据任意多个信息类型,获取所述信息类型的信息数据对多个用户进行推送。信息数据的获取,包括:根据信息类型,获取初步信息数据,对初步信息数据进行处理,过滤非法数据或虚假数据,生成样本数据,对样本数据进行修订,修订后进行审核,审核通过后生成信息数据。本专利技术选择粮食行业进行进一步说明,实施例如下:设定粮食行业从业者用户群X{X1..X10},订阅价格类数据集I{I1..I5},每个用户订阅数据如下:根据Apriori算法支持度与置信度,确定上述X用户群订阅信息集I中,信息之间的关联规则。根据大多数行业关联规则标准,当最小支持度min_Sup=0.2,最小置信度min_con=0.7,信息之间存在强关联规则,可进行推荐。对订阅记录D进行支持度迭代计算得到订阅事件集C1;事件集C1支持度计数{I1}0.4{I2}0.7{I3}0.7{I4}0.4{I5}0.4比较事本文档来自技高网
...

【技术保护点】
1.一种基于数据关联关系进行推送信息的方法,所述方法包括:/n采集用户群中每个用户的基本信息,根据用户群中每个用户的基本信息,对用户群中的用户进行相近分类,为相近的每一类用户建立相近集合;/n确定相似集合中的每个用户的需求的信息类型,生成订阅集合;/n确定订阅集合中每个用户同时订阅任意多个信息类型的概率,确定任意两个信息类型间的关联规则,根据关联规则确定任意多个信息类型的支持度;/n确定订阅集合中每个用户订阅任意多个信息类型的基础上订阅其他信息类型的概率,获取所述任意多个信息类型和其他信息类型的置信度;/n所述任意多个信息类型与所述任意多个信息类型和其他信息类型为相同的信息类型;/n确定支持度和置信度,是否满足推送条件,若支持度和置信度同时满足最小支持度阈值概率和最小置信度阈值概率,确定任意多个信息类型为强关联信息类型,并根据任意多个信息类型,获取所述信息类型的信息数据对多个用户进行推送。/n

【技术特征摘要】
1.一种基于数据关联关系进行推送信息的方法,所述方法包括:
采集用户群中每个用户的基本信息,根据用户群中每个用户的基本信息,对用户群中的用户进行相近分类,为相近的每一类用户建立相近集合;
确定相似集合中的每个用户的需求的信息类型,生成订阅集合;
确定订阅集合中每个用户同时订阅任意多个信息类型的概率,确定任意两个信息类型间的关联规则,根据关联规则确定任意多个信息类型的支持度;
确定订阅集合中每个用户订阅任意多个信息类型的基础上订阅其他信息类型的概率,获取所述任意多个信息类型和其他信息类型的置信度;
所述任意多个信息类型与所述任意多个信息类型和其他信息类型为相同的信息类型;
确定支持度和置信度,是否满足推送条件,若支持度和置信度同时满足最小支持度阈值概率和最小置信度阈值概率,确定任意多个信息类型为强关联信息类型,并根据任意多个信息类型,获取所述信息类型的信息数据对多个用户进行推送。


2.根据权利要求1所述的方法,所述用户基本信息,包括:用户所在区域、用户身份信息和用户所属行业。


3.根据权利要求1所述的方法,所述最小支持度阈值概率为0.2。


4.根据权利要求1所述的方法,所述最小置信度阈值概率为0.7。


5.根据权利要求1所述的方法,所述信息数据的获取,包括:
根据信息类型,获取初步信息数据,对初步信息数据进行处理,过滤非法数据或虚假数据,生成样本数据,对样本数据进行修订,修订后进行审核,审核通过后生成信息数据。


6.一...

【专利技术属性】
技术研发人员:贺铭刘申张彧豪张虎成
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1