基于搜索埋点的决策数据挖掘方法技术

技术编号:14349276 阅读:65 留言:0更新日期:2017-01-04 19:54
本发明专利技术提供了一种基于搜索埋点的决策数据挖掘方法,步骤包括:1)埋点系统搜集用户输入的搜索行为;2)搜索行为实时计算系统实时统计在可配置时间段内的用户搜索关键字及其对应的结果数;3)过滤掉结果数表示关键字有匹配的搜索内容的搜索行为;4)得出在可配置时间段内用户搜索该关键字没有搜索到匹配内容的次数;5)同步到决策支持系统,直到累计可配置时间段时间达到计划时间为止;6)按关键字没有搜索到匹配内容的频率进行排序后以关键字为单位对数据进行展示。本发明专利技术从实时分析用户未找到的商品相关的信息的角度为决策支持系统能够做出有效决策,为各行业的企业或个人提供参考、辅助作用。

【技术实现步骤摘要】

本专利技术涉及信息处理技术,特别是一种基于搜索埋点的决策数据挖掘方法
技术介绍
当前,人们生活在大数据时代,各种数据爆炸式增长,每天均有大量的资讯、娱乐、财经、医疗、教育等各行各业的信息数据注入网络,形成海量数据。从这些海量数据中挖掘出有价值的数据,并对其进行分析做出有效决策,为各行业的企业或个人提供参考、辅助作用。例如,网上购物也已经成为人们主要的购物方式之一,用户只需要联网操作不出家门即可获得较为满意的商品。购物系统需要实时分析用户浏览过或购买过的记录,为了给用户推荐准确的商品,购物系统需要依赖庞大的商品信息数据库。现有的决策支持系统还没有通过实时分析用户未找到的商品相关的信息的角度给用户推荐准确的商品信息。
技术实现思路
针对所提到的问题,本专利技术提供了一种基于搜索埋点的决策数据挖掘方法,步骤包括:1)埋点系统搜集用户输入的搜索行为,所述搜索行为包括:关键字及所述关键字对应的结果数,所述结果数用来区分所述关键字是否有匹配的搜索内容;2)所述搜索行为实时计算系统过滤掉结果数表示所述关键字有匹配的搜索内容的搜索行为;3)所述搜索行为实时计算系统统计相同“关键字”的数目,所述数目即为在可配置时间段内所述用户搜索该关键字没有搜索到匹配内容的次数;4)所述搜索行为实时计算系统将步骤3得出的数据同步到决策支持系统,所述搜索行为实时计算系统继续统计下一个可配置时间段内所述用户搜索该关键字没有搜索到匹配内容的次数,然后将所得数据同步到决策支持系统,直到累计可配置时间段时间达到计划时间为止;5)所述决策支持系统接收步骤4的同步的数据后,按关键字没有搜索到匹配内容的频率进行排序后以关键字为单位对数据进行展示。优选方案是:所述搜索行为解析成至少包括以下字段的格式数据:{关键字,用户ID,会话ID,结果数本文档来自技高网...

【技术保护点】
基于搜索埋点的决策数据挖掘方法,其特征在于,步骤包括:1)埋点系统搜集用户输入的搜索行为,所述搜索行为包括:关键字及所述关键字对应的结果数,所述结果数用来区分所述关键字是否有匹配的搜索内容;2)所述搜索行为实时计算系统过滤掉结果数表示所述关键字有匹配的搜索内容的搜索行为;3)所述搜索行为实时计算系统计相同“关键字”的数目,所述数目即为在可配置时间段内所述用户搜索该关键字没有搜索到匹配内容的次数;4)所述搜索行为实时计算系统将步骤3得出的数据同步到决策支持系统,所述搜索行为实时计算系统继续统计下一个可配置时间段内所述用户搜索该关键字没有搜索到匹配内容的次数,然后将所得数据同步到决策支持系统,直到累计可配置时间段时间达到计划时间为止;5)所述决策支持系统接收步骤4的同步的数据后,按关键字没有搜索到匹配内容的频率进行排序后以关键字为单位对数据进行展示。

【技术特征摘要】
1.基于搜索埋点的决策数据挖掘方法,其特征在于,步骤包括:1)埋点系统搜集用户输入的搜索行为,所述搜索行为包括:关键字及所述关键字对应的结果数,所述结果数用来区分所述关键字是否有匹配的搜索内容;2)所述搜索行为实时计算系统过滤掉结果数表示所述关键字有匹配的搜索内容的搜索行为;3)所述搜索行为实时计算系统计相同“关键字”的数目,所述数目即为在可配置时间段内所述用户搜索该关键字没有搜索到匹配内容的次数;4)所述搜索行为实时计算系统将步骤3得出的数据同步到...

【专利技术属性】
技术研发人员:张天祥杨爱民
申请(专利权)人:北京金和网络股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1