一种基于行为分析的大数据智能推荐查询方法和系统技术方案

技术编号:25637028 阅读:17 留言:0更新日期:2020-09-15 21:29
本发明专利技术提供一种基于行为分析的大数据智能推荐查询方法,所述方法包括如下步骤:S1:从用户日志系统中提取用户的数据查询记录;S2:根据步骤S1中取得的所述数据查询记录进行热点数据分析;S3:根据步骤S2中得到的热点数据分析结果构建查询模型。本发明专利技术提供了一种方法通过对用户行为分析技术,有效发现不同业务用户的数据热度,根据用户的行为习惯进行提前推荐数据,实现数据高速查询。

【技术实现步骤摘要】
一种基于行为分析的大数据智能推荐查询方法和系统
本专利技术属于互联网信息领域,特别涉及一种基于行为分析的大数据智能推荐查询方法和系统。
技术介绍
目前在各种业务系统当中普遍使用传统的关系型数据库Oracle,由于传统的关系型数据库的特性,随着业务数据积累时间的积累以及每天入库的数据量的增加,业务数据查询的速度也会大大延长,这会严重降低服务器端的日常工作效率和工作进度,影响用户的使用体验,延长用户端信息查询的反应时间。因此,亟需一种大数据环境下,用户查询快速响应的查询方法。
技术实现思路
针对上述问题,本专利技术提供一种基于行为分析的大数据智能推荐查询方法,所述方法包括如下步骤:S1:从用户日志系统中提取用户的数据查询记录;S2:根据步骤S1中取得的所述数据查询记录进行热点数据分析;S3:根据步骤S2中得到的热点数据分析结果构建查询模型。进一步地,在步骤S2中所述热点数据分析具体包括如下步骤:S21:从所述数据查询记录中提取用户查询数据的主要条件;S22:根据步骤S21中所述主要条件,提取用户的浏览兴趣模式和频繁项特征,采用用户隔离模式计算出不同用户行为的操作权重值;S23:根据步骤S21中所述主要条件,从用户日志系统中提取出用户查询操作的输入、输出参数;S24:根据步骤S22中所述操作权重值,对用户浏览数据查询功能次数和对应的查询条件出现次数计算操作权重值,并将操作权重值、查询功能、查询条件、用户信息形成用户行为模型,并对模型进行归档处理;S25:根据步骤S24中形成的用户行为模型、步骤S23中从用户日志系统中提取得到的输入、输出参数,将操作权值满足指定阈值的用户模型数据对应的源数据作为用户热点数据。进一步地,步骤S22具体包括如下步骤:S221:按照定量统计法,把查询条件赋值为m,兴趣模式赋值为n,则兴趣模式和频繁项特征的权重比分别为:S222:根据步骤S221兴趣模式和频繁项特征的权重比计算兴趣模式和频繁项特征的操作权重值:其中,x为兴趣模式出现次数,y为频繁项特征出现次数;S223:根据兴趣模式和频繁项特征权重大小,采用基于内容的推荐算法,获取与用户爱好一致性较高的数据:用户u的兴趣爱好向量ContentBasedProfile(u)可由如下公式得到:其中N(u)是用户之前查询的数据集合;simd∈N(u)Content(i[1,m])表示用户数据偏好相似度;Content(i[1,m])表示兴趣模式权重和/或频繁项特征权重前m个内容向量;一个新数据项j与用户u喜好的相似度p(u,j)可由如下公式得到:p(u,j)=sim(ContentBasedProfile(u),Content(j))。进一步地,在步骤S3中,构建查询模型包括如下步骤:S31:统一日志输出数据结构,统一日志输出位置;S32:在步骤S31中统一日志输出数据结构之后的日志输出位置,根据步骤S2中得到的热点数据分析结果创建数据查询模型;S33:日志数据持久化。进一步地,在步骤S31中,所述统一日志输出数据结构,统一日志输出位置具体包括如下步骤:S311:重新组织日志分析的数据结构;根据步骤S2中得到热点数据分析结果所需的数据参数,添加新的日志数据;所述日志数据包括用户名称、用户操作模块类型、用户操作时间、用户输入和输出参数。进一步地,在步骤S33中,所述日志数据持久化包括如下步骤:S331:配置日志数据的持久化范围;对用户的一种或多种操作进行持久化控制;S332:对用户日志数据进行过滤清洗;将步骤S321中持久化控制的日志数据进行采集,并对采集到的日志数据根据有效日志规则进行筛选,获取有效的日志数据;S333:存储清洗后的日志数据;将清洗过后的有效的日志数据写入日志持久化队列中,由所述日志持久化队列的消费者对日志数据进行处理;S334:日志数据入库;当所述日志持久化队列的消费者监控到队列中有所述日志数据进入时,按照队列的入队顺序循环弹出,将得到的所述日志数据写入到数据库中存储。进一步地,方法还包括:包括步骤S4,所述步骤S4包括:从构建得到的所述查询模型中提取查询数据推送给用户。进一步地,在步骤S4中,所述查询模型通过设置过滤条件提取所述查询数据。进一步地,所述过滤条件为话单数据;所述话单数据包括局点数据、局向数据、电话呼叫时间数据、来源地数据、被叫地数据、话题分类数据、通话时长数据、模板号数据、状态数据中的一种或多种。本专利技术还提供了一种用于实现上述行为分析的大数据智能推荐查询方法的系统,所述系统包括:数据源提取模块,所述数据源提取模块用于从用户日志系统中提取用户的数据查询记录;数据分析模块,所述数据分析模块与所述数据源提取模块相连,用于进行热点数据分析;数据建模模块,所述数据建模模块与所述数据分析模块相连,用于构建查询模型;数据推送模块,所述数据推送模块与所述数据建模模块相连,用于从构建得到的所述查询模型中提取查询数据推送给用户。本专利技术提供了一种基于行为分析的大数据智能推荐查询方法和系统,通过对系统用户行为分析技术,有效发现不同业务用户的数据热度,根据用户的行为习惯进行提前推荐数据,通过对数据热度的不同自动优化数据查询模型,实现数据高速查询,在用户查询相应数据时,可以在极短的时间内进行快速查询到对应结果,同时有针对性的向用户推送关联性高的信息。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术实施例中的一种基于行为分析的大数据智能推荐查询方法的流程图;图2示出了本专利技术实施例中的一种用于实现基于行为分析的大数据智能推荐查询方法的系统的结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为解决用户在工作中数据查询速度过慢的问题,本专利技术对现有系统进行改造,根据用户的行为习惯进行提前推荐数据,在用户查询相应数据时可以在极短的时间内进行快速查询到对应结果。本文档来自技高网...

【技术保护点】
1.一种基于行为分析的大数据智能推荐查询方法,其特征在于,所述方法包括如下步骤:/nS1:从用户日志系统中提取用户的数据查询记录;/nS2:根据步骤S1中取得的所述数据查询记录进行热点数据分析;/nS3:根据步骤S2中得到的热点数据分析结果构建查询模型。/n

【技术特征摘要】
1.一种基于行为分析的大数据智能推荐查询方法,其特征在于,所述方法包括如下步骤:
S1:从用户日志系统中提取用户的数据查询记录;
S2:根据步骤S1中取得的所述数据查询记录进行热点数据分析;
S3:根据步骤S2中得到的热点数据分析结果构建查询模型。


2.根据权利要求1所述的基于行为分析的大数据智能推荐查询方法,其特征在于,在步骤S2中所述热点数据分析具体包括如下步骤:
S21:从所述数据查询记录中提取用户查询数据的主要条件;
S22:根据步骤S21中所述主要条件,提取用户的浏览兴趣模式和频繁项特征,采用用户隔离模式计算出不同用户行为的操作权重值;
S23:根据步骤S21中所述主要条件,从用户日志系统中提取出用户查询操作的输入、输出参数;
S24:根据步骤S22中所述操作权重值,对用户浏览数据查询功能次数和对应的查询条件出现次数计算操作权重值,并将操作权重值、查询功能、查询条件、用户信息形成用户行为模型,并对模型进行归档处理;
S25:根据步骤S24中形成的用户行为模型、步骤S23中从用户日志系统中提取得到的输入、输出参数,将操作权值满足指定阈值的用户模型数据对应的源数据作为用户热点数据。


3.根据权利要求2所述的基于行为分析的大数据智能推荐查询方法,其特征在于,步骤S22具体包括如下步骤:
S221:按照定量统计法,把查询条件赋值为m,兴趣模式赋值为n,则兴趣模式和频繁项特征的权重比分别为:






S222:根据步骤S221兴趣模式和频繁项特征的权重比计算兴趣模式和频繁项特征的操作权重值:






其中,x为兴趣模式出现次数,y为频繁项特征出现次数;
S223:根据兴趣模式和频繁项特征权重大小,采用基于内容的推荐算法,获取与用户爱好一致性较高的数据:
用户u的兴趣爱好向量ContentBasedProfile(u)可由如下公式得到:



其中N(u)是用户之前查询的数据集合;simd∈N(u)Content(i[1,m])表示用户数据偏好相似度;Content(i[1,m])表示兴趣模式权重和/或频繁项特征权重前m个内容向量;
一个新数据项j与用户u喜好的相似度p(u,j)可由如下公式得到:
p(u,j)=sim(ContentBasedProfile(u),Content(j))。


4.根据权利要求3所述的基于行为分析的大数据智能推荐查询方法,其特征在于,在步骤S3中,构建查询模型包括如下步骤:
S31:统一日志输出数据结构,统一日...

【专利技术属性】
技术研发人员:王中华李新刘志会郭成科
申请(专利权)人:国家计算机网络与信息安全管理中心天津市国瑞数码安全系统股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1