当前位置: 首页 > 专利查询>刘峰专利>正文

智能个性化服务网站构造方法技术

技术编号:2826952 阅读:293 留言:0更新日期:2012-04-11 18:40
智能个性化服务网站构造方法,是一个简单、易用、高效、通用的网站个性化服务方法。本方法封装了复杂的知识表达和知识获取过程,不直接参与“个性化服务”,以“中间件”方式,给网站应用程序提供每个客户的“个性”。将每个客户的“个性”抽象为“内容喜好”、“预测喜好”和“访问习惯”3个集合,利用数据挖掘技术,通过建立动态学习集办法,持续不断地更新知识库,跟踪分析每个客户“个性”,以API方式,给网站应用程序提供客户的“个性”。网站应用程序可根据所提供的客户“内容喜好”和、“预测喜好”,安排网页内容;根据客户的“访问习惯”,安排客户可以下一步访问网站的索引链接,来达到个性化服务目的。

【技术实现步骤摘要】

本专利技术涉及智能化网站构造技术,应用对象是互联网的网站。任何网站都 可以利用本专利技术技术,实现针对不同的访问用户,安排网页内容和布局,为每 个访问者提供个性化服务。
技术介绍
现在的网站内容安排大多数都是静态的,网页上的内容和布局是事先设计 好的,对所有访问者都是固定不变的,不能根据每个访问者的个性来提供个性 化服务。很多学者提出了下一代互联网Web 3.0的概念,虽然Web3.0并没有 准确的定义,但其核心思路是更加智能化的互联网。如何让互联网更加智能化,网站服务的智能化是其发展的重要组成部分。 数据挖掘技术起源于上个世纪90年代,其核心思想是从大量的、不完 全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们 事先不知道的、但又是潜在有用的信息和知识的过程。现在有很多人研究数据 挖掘技术,并将其运用到网站个性化服务,取得了很多成果。有些成果已经得 到实际应用,并获得了较满意的成效。但也有很多成果在理论上很好,由于计 算量大、算法过于复杂,离实际应用还存在相当的距离,在实用上存在诸多的 不便。即便是已经应用的成果,也存在个性化知识的描述和提取方法的方面的 缺陷,个性化刻画不够全面、准确以及通用性不强等问题。目前大多数实现网站个性化服务的方法,都存在两个问题-第一、.个性不强观在很多方法和已经实现的系统,不是针对每个客户的个性化服务, 而是针对类的个性化服务。很多个性化服务都是通过数据挖掘中的 聚类办法,将客户划分成若干个类,当问客访问网站时,先将用户影射 到所事先划分好的类中,再根据类的个性进行个性化服务。严格上 讲,这并不是针对每个用户的个性化服务,而是针对类的个性化服务。 第二、只强调客户对内容的兴趣,忽略了访问习惯一个客户访问网站,就如同进入一个商场,不仅仅可以通过其购买的 商品反映客户的个性,'还可以通过其逛商场的习惯行进路径,如先逛什 么地方、再看什么商品等来反映客户的个性。 一个人访问网站的也是一样, 不仅仅是通过其浏览了哪些内容可以反映一个人的个性,还可以通过其习 惯性的访问路径先看什么内容、后看什么内容来反映一个人的个性。现在所有实现网站个性化服务的方法,都忽略了客户的访问习惯路 径,只是单纯地从用户访问网站的内容来抽取个性。显然,只针对用尸访问内容而不考虑访问行为习惯的个性化服务还是不完备的。 专利技术.内容为了解决上述存在的问题,本专利技术不将用户划分成类,而是完全针对每 个用户进行真正的个性化服务。将每个用户访问网站的个性进行了更加详细 的数字化分析,将个性抽象为三个集合内容喜好集合、预测喜好集合和 访问习惯集合。内容喜好集合反映一个人对网站各个栏目内容的喜好程度。 预测喜好集合对于没有包含在内容喜好中网站栏目喜好的预测,是通过对于与该用户有相似内容喜好用户的栏目进行关联分析所得到的。访问习惯集合是每个用户每次访问网站最频繁出现的栏目访问行为轨迹。本专利技术不直接参与最终的个性化服务,而是以中间件的形式提供给网站 应用程序,由网站应用程序根据中间件提供的用户个性知识,来安排网页内容、 页面架构和布局,提供下一步操作的链接索引,从而达到网站智能个性化服务。 本专利技术目的是通过下述技术方案实现的 ,步骤如下(1 )数据监测与清洗程序每天定时读取访问记录,并对访问记录进行分析、 清洗、过滤,.形成符合客户个性学习记录,存入用户个性学习集内;(2) 用户内容喜好分析程序对用户个性学习集中记录进行统计分析,得 到用户访问网站各个栏目分别占总栏目访问数的百分比集合,即内容喜好集 合,并保存到个性知识库中,同时形成每个用户的内容喜好集合记录;(3) 预测喜好程序分析程序,以每个用户的内容喜好中的栏目为基本集合,选择所有其他用户内容喜好中包含该用户内容喜好栏目的记录,得 到每个用户的相似喜好记录;在这些记录中,以用户的内容喜好栏目为基本条件/分别对不包含在内容喜好的栏目分别逐个进行关联分析,并按出现频率和支持度进行排序,得到每个用户的预测喜好,保存到个性知识库中;(4) 访问习惯分析程序,对用户个性学习集中记录进行统计分析,抽取 客户最经常出现的访问栏目访问行为轨迹,作为访问习惯个性保存到个性 知识库。(5)通过系统接口程序与网站应用程序进行交互,应用程序将用户ID交 给系统,系统判断如客户ID在知识库中,系统将用户的个性内容喜好、预 测喜好和访问习惯返回给应用程序。用户个性学习集,为每个用户保存规定数量的学习记录,当某个用户学 习记录大规定数量时,删除旧的记录,补充最新的记录,以保证用户个性学习 集是最近的记录。数据监测与清洗程序步骤如下(1) 每天定时读取访问记录,将没有访问会话标识Session ID的访问记录 转换为有会话标识Session ID的访问记录;(2) URL栏目转换模块读取访问会话Session记录,查找URL栏目对照表, 判断URL所属栏目,将访问会话Session记录的URL转换为栏目,保存到用户 栏目访问记录;(3) 栏目归并当一个访问步骤中包含多个相同栏目时,用l个栏目来代 替,对栏目访问记录进行归并;内容喜好分析程序的步骤如下(1) 读取用户个性学习集的记录,统计用户栏目访问数;(2) 汇总用户栏目总访问数;(3) 分别计算客户访问每个栏目数占总栏目访问数的百分比,得出客户对 网站的内容喜好;(4) 将客户对网站的内容喜好保存到个性知识库中,同时临保存到客户 对网站内容喜好中,供分析预测喜好使用。预测喜好分析程序步骤如下(1) 读取内容喜好集合的记录,找出包含该内容喜好的其他用户 内容喜好记录,为相似喜好记录;(2) 分别统计相似喜好记录中,不包含在内容喜好中出现栏目的 出现次数,再被相似喜好记录总数除,得到这些栏目的出现频率;(3) 对上面出现频率进行排序,以排序结果的先后次序,组成预测喜好隹a.呆口 ;(4) 将每个用户的预测喜好保存到个性知识库中。 访问习惯分析程序步骤如下(1) 读取用户个性学习集的记录,统计每个用户栏目访问序列出现次数;(2) 对访问系列出现次数进行排序,得到最频繁出现的栏目访问序列;(3) 将最频繁出现的栏目访问序列作为访问习惯,保存到个性知识库中。系统接口程序步骤如下(1) 当.某个用户访问网站时,应用程序将用户识别ID传送给应用接口程序,应用.接口程序判断用户识别ID是否在个性知识库中存在?(2) 如果存在,提取内容喜好、预测喜好和访问习惯,以扩展 标记语言XML格式返回给网站应用程序;(3) 如果不存在,应用接口程序返回没有个性信息。 本专利技术的有益效果本专利技术将访问网站用户的个'哮,数字化地定义和描述为内容喜好、预 测喜好和访问习惯。内容喜好刻画用户对网站内容的基本内容喜好;预测 喜好通过比较与该用户相似的其他用户的内容喜好,得到不在该用户内容喜好内的扩展预测喜好;访问.习惯描述用户经常出现的访问行为路径,用 这3个数字化分析和刻画,构成对每个用户个性全面数字化描述的个性知识 库。系统为访问网站的每个用户动态地建立知识库,通过连续地学习过程,不断地自动更新知识库,跟踪用户个性变化,网站应用程序可以根据提供的API接口,获得每个访问者的个性,然后,根据每个用户的内容喜好和预测喜好,自动产生网页内容;根据各自的访问习本文档来自技高网...

【技术保护点】
智能个性化服务网站构造方法,其特征在于:步骤如下:(1)数据监测与清洗程序每天定时读取访问记录,并对访问记录进行分析、清洗、过滤,形成符合客户个性学习记录,存入“用户个性学习集”内;(2)用户内容喜好分析程序对“用户个性学习集”中记录进行统计分析,得到用户访问网站各个栏目分别占总栏目访问数的百分比集合,即“内容喜好”集合,并保存到“个性知识库”中,同时形成每个用户的“内容喜好”集合记录;(3)预测喜好程序分析程序,以每个用户的“内容喜好”中的栏目为基本集合,选择所有其他用户“内容喜好”中包含该用户“内容喜好”栏目的记录,得到每个用户的“相似喜好”记录;在这些记录中,以用户的“内容喜好”栏目为基本条件,分别对不包含在“内容喜好”的栏目分别逐个进行关联分析,并按出现频率和支持度进行排序,得到每个用户的“预测喜好”,保存到“个性知识库”中;(4)访问习惯分析程序,对“用户个性学习集”中记录进行统计分析,抽取客户最经常出现的访问栏目访问行为轨迹,作为“访问习惯”个性保存到“个性知识库”;(5)通过系统接口程序与网站应用程序进行交互,应用程序将用户ID交给系统,系统判断如客户ID在知识库中,系统将用户的个性:“内容喜好”、“预测喜好”和“访问习惯”返回给应用程序。...

【技术特征摘要】
1、智能个性化服务网站构造方法,其特征在于步骤如下(1)数据监测与清洗程序每天定时读取访问记录,并对访问记录进行分析、清洗、过滤,形成符合客户个性学习记录,存入“用户个性学习集”内;(2)用户内容喜好分析程序对“用户个性学习集”中记录进行统计分析,得到用户访问网站各个栏目分别占总栏目访问数的百分比集合,即“内容喜好”集合,并保存到“个性知识库”中,同时形成每个用户的“内容喜好”集合记录;(3)预测喜好程序分析程序,以每个用户的“内容喜好”中的栏目为基本集合,选择所有其他用户“内容喜好”中包含该用户“内容喜好”栏目的记录,得到每个用产的“相似喜好”记录;在这些记录中,以用户的“内容喜好”栏目为基本条件,分别对不包含在“内容喜好”的栏目分别逐个进行关联分析,并按出现频率和支持度进行排序,得到每个用户的“预测喜好”,保存到“个性知识库”中;(4)访问习惯分析程序,对“用户个性学习集”中记录进行统计分析,抽取客户最经常出现的访问栏目访问行为轨迹,作为“访问习惯”个性保存到“个性知识库”;(5)通过系统接口程序与网站应用程序进行交互,应用程序将用户ID交给系统,系统判断如客户ID在知识库中,系统将用户的个性“内容喜好”、“预测喜好”和“访问习惯”返回给应用程序。2、根据权利要求1所述的根据权利要求1所述的智能个性化服务网站构造 方法,其特征在于所述的用户个性学习集,为每个用户保存规定数量的学习记录,当某个用户学习记录大规定数量时,删除旧的记录,补充最新的记录, 以保证用户个性学习集是最近的记录。3、 根据权利要求1所述的智能个性化服务网站构造方法,其特征在于所 述的数据监测与清洗程序步骤如下(1) 每天定时读取访问记录,将没有访问会话标识Session ID的访问记录 转换为有会话标识Session ID的访问记录;(2) URL栏目转换模块读取访问会话Session记录,查找URL栏目对照表, 判断URL所属栏,,将...

【专利技术属性】
技术研发人员:刘峰孙宏
申请(专利权)人:刘峰孙宏
类型:发明
国别省市:89[中国|沈阳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1