一种互联网用户行为的获取方法和系统技术方案

技术编号:3543248 阅读:174 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种互联网用户行为的获取方法和系统;方法包括:在互联网信息资源中嵌入收集脚本采集用户行为的行为信息并保存;所述行为信息包括:进行本次用户行为的用户的标识,本次用户行为的类型、对象;结合用户行为的行为信息,及用于指示本次用户行为对象内容的描述信息,确定各次用户行为的语义信息;对于不同用户的用户行为的语义信息,根据所述用户的标识归类后进行保存。能够对互联网用户行为进行采集和以用户为单位进行整理,并获得和了解互联网用户的行为及其所蕴含的语义信息。

【技术实现步骤摘要】

本专利技术涉及网络领域,尤其涉及一种互联网用户行为的获取方法和系统
技术介绍
互联网用户行为是指互联网用户使用互联网软件和互联网信息进行交互 的行为,主要包括获取和提供互联网信息。其中,获取互联网信息包括通过 网络浏览器浏览互联网网页和多媒体信息、通过互联网软件内嵌的播放器查看Flash等多媒体信息等等;提供互联网信息包括通过搜索引擎提供关键词进 行搜索提供查询信息,对互联网链接进行点击提供链接点击信息等等。现有的技术大多集中在收集互联网用户的行为方面;对互联网用户行为 的收集是指获得互联网用户在互联网上采取了什么样的行为,以及这些行为 的相关信息,其中包括用户行为的类型和对象(和什么资源发生交互行为), 行为发生的时间,行为发生的地点(用户的IP地址和对应行政区划位置), 行为采用的媒介(采用什么样的计算机,什么样的操作系统,什么样的软件) 等。现有技术的通常做法是通过在互联网资源中嵌入行为收集脚本来获取用 户互联网使用日志等。但是,简单的互联网使用日志有以下的局限性它没有包含用户的标识 信息,因此无法对用户的行为进行以用户为基本单位的整理;它并不是以 互联网用户为基本单位进行信息整理和存储的,而是以用户的交互动作(如 浏览网页,点击链接)为基本单位来保存信息的。这样的信息,对统计网络 流量这样的任务是足够的,但是对互联网用户行为的深入理解,对互联网用 户的统一理解,从而基于此深入理解提供优质的个性化服务是十分不够的。现有的技术大多只是对用户的上网时间、地点、浏览器等简单属性做分 析,并没有通过用户行为对象的内容进行内容分析对这些行为做解释。这样 的分析,所包含的信息量比较有限,缺少用户的使用互联网的目的、意图等语义方面的信息,从而无法完全理解用户的行为习惯和兴趣爱好。
技术实现思路
本专利技术要解决的技术问题是提供一种互联网用户行为的获取方法和系 统,能够对互联网用户行为进行采集和以用户为单位进行整理,并获得和了 解互联网用户的行为及其所蕴含的语义信息。为了解决上述问题,本专利技术提供了一种互联网用户行为的获取方法,包括在互联网信息资源中嵌入收集脚本采集用户行为的行为信息并保存;所 述行为信息包括进行本次用户行为的用户的标识,本次用户行为的类型、 对象;结合用户行为的行为信息,及用于指示本次用户行为对象内容的描述 信息,确定各次用户行为的语义信息;对于不同用户的用户行为的语义信息, 根据所述用户的标识归类后进行保存。进一步的,所述用户行为的对象为互^:网信息资源;所述获取方法还包括对于各互联网信息资源,确定用于指示该互联网 信息资源内容的描述信息。进一步的,所述行为信息还包括以下任一个或任几个用户行为发生的 时间、地点,及采用的4某介;所述获取方法还包括对用户的用户行为的语义信息按照参数进行统计,组成该用户的习惯信 息;所述参数包括以下中的任一个或任几个(1)用户行为的对象及类型; (2)用户行为的时间;(3)用户行为的地点;及(4 )用户行为采用的i某介。 进一步的,所述的获取方法还包括以用户的标识作为索引,建立用户的标识与该用户相关行为信息存储位 置之间的对应关系;其中,所述用户相关行为信息包括以下中的任一个或任 几个所采集的行为信息、语义信息及习惯信息;根据待查询用户的用户标识读取索引,获得待查询用户的相关行为信息 的存储位置;在所述存储位置中读取所述待查询用户的相关行为信息。进一步的,所述的获取方法还包括按照对期望用户的要求预先设定筛选项目,从所述根据用户的标识归类 后的用户行为的语义信息中,将期望用户筛选出来。本专利技术还提供了一种互联网用户行为的获取系统,包括用户行为收集子系统;用户行为收集子系统包括嵌入互联网信息资源中的若干个收集脚本 和用户行为收集服务器;所述收集脚本用于釆集用户行为的行为信息并保存 到所述用户行为收集服务器上;还包括用户行为分析子系统及用户行为记录子系统;所述行为信息包括进行本次用户行为的用户的标识,本次用户行为的 类型、对象;所述用户行为分析子系统用于结合用户行为的行为信息,及用于指示本 次用户行为对象内容的描述信息,确定各次用户行为的语义信息并保存;所述用户行为记录子系统用于对于不同用户的用户行为的语义信息,才艮 据所述用户的标识归类后保存。进一步的,所述用户行为的对象为互联网信息资源;所述用户行为分析子系统还用于对于各互联网信息资源确定用于指示该 互联网信息资源内容的描述信息。进一步的,所述行为信息还包括以下任一个或任几个用户行为发生的 时间、地点,及采用的i某介;所述用户行为记录子系统还用于对用户的用户行为的语义信息按照参数 进行统计,组成该用户的习惯信息并保存;所述参数包括以下中的任一个或 任几个(1)用户行为的对象及类型;(2)用户行为的时间;(3)用户行 为的地点;及(4)用户行为采用的々某介。进一步的,所述的获取系统还包括用户行为查询子系统,用于以用户的标识作为索引,建立用户的标识与 该用户相关行为信息存储位置之间的对应关系;其中,所述用户相关行为信 息包括以下中的任一个或任几个所采集的行为信息、语义信息及习惯信息;所述用户行为查询子系统还用于根据待查询用户的用户标识读取索引,获得待查询用户的相关行为信息的存储位置;在所述存储位置中读取所述待查询用户的相关行为信息。进一步的,所述用户行为查询子系统还用于按照对期望用户的要求预先 设定筛选项目,从所述根据用户的标识归类后的用户行为的语义信息中,将 期望用户筛选出来。本专利技术的技术方案通过网页或者其他互联网信息资源(如Flash)访问互 联网内容的用户行为进行收集、分析、记录和查询,通过对用户行为信息的 整合以及结合用户行为对象的内容分析来弥补以上现有技术的不足,可以完 成对互联网用户行为的采集,对行为所包含的内容含义进行分析和解释,还 可以进一步快速检索获得每一个用户的行为的语义信息。附图说明图1是互联网用户行为的获取装置的一个实施例的示意框图。 具体实施例方式下面将结合实施例对本专利技术的技术方案进行更详细的说明。在本文中,互联网信息资源是指存在于互联网这个分布式系统上的包 含信息内容的数字资源,包括软件,文档,网页,视频,音频等等;互联网用户行为的语义信息是指通过对互联网用户行为(如获取,发 布和交流信息)所发生的时间、地点、行为方式、行为4某介和行为内容的分 析,获得的互联网用户在互联网上发生的用户行为的模式特征。对互联网用户行为的分析是指通过对收集获得的互联网用户行为信息 的整理,以及互联网用户行为对象的分析,对这些行为进行更加详细更加具 有语义信息的解释。对互联网用户行为的记录是指采用 一种存储方式记录和保存以上收集 的原始信息和分析获得的信息。对互联网用户行为的查询是指建立一种索引,便于快速高效地获得每个互联网用户对应的行为及其分析结果。获取互联网用户行为包括获取用户行为本身及其语义信息;另外,在有 些实施例中,还可以包括查询、筛选这类有针对性、目的性的获取。本专利技术提出一种互联网用户行为的获取方法,包括在互联网信息资源中嵌入收集脚本采集用户行为的行为信息并保存;所 述行为信息包括进行本次用户行为的用户的标识,本次用户行为的类型、 对象;结合用户行为的行为信息及用于指示本次用户行为对象内容的描述本文档来自技高网
...

【技术保护点】
一种互联网用户行为的获取方法,包括: 在互联网信息资源中嵌入收集脚本采集用户行为的行为信息并保存;所述行为信息包括:进行本次用户行为的用户的标识,本次用户行为的类型、对象;结合用户行为的行为信息,及用于指示本次用户行为对象内容的描述信 息,确定各次用户行为的语义信息;对于不同用户的用户行为的语义信息,根据所述用户的标识归类后进行保存。

【技术特征摘要】
1、一种互联网用户行为的获取方法,包括在互联网信息资源中嵌入收集脚本采集用户行为的行为信息并保存;所述行为信息包括进行本次用户行为的用户的标识,本次用户行为的类型、对象;结合用户行为的行为信息,及用于指示本次用户行为对象内容的描述信息,确定各次用户行为的语义信息;对于不同用户的用户行为的语义信息,根据所述用户的标识归类后进行保存。2、 如权利要求1所述的获取方法,其特征在于,所述用户行为的对象为 互联网信息资源;所述获取方法还包括对于各互联网信息资源,确定用于指示该互联网 信息资源内容的描述信息。3、 如权利要求1或2所述的获取方法,其特征在于,所述行为信息还包 括以下任一个或任几个用户行为发生的时间、地点,及采用的^ 某介;所述获取方法还包括对用户的用户行为的语义信息按照参数进行统计,组成该用户的习惯信 息;所述参数包括以下中的任一个或任几个(1)用户行为的对象及类型; (2)用户行为的时间;(3)用户行为的地点;及(4 )用户行为采用的々某介。4、 如权利要求3所述的获取方法,其特征在于,还包括以用户的标识作为索引,建立用户的标识与该用户相关行为信息存储位 置之间的对应关系;其中,所述用户相关行为信息包括以下中的任一个或任 几个所采集的行为信息、语义信息及习惯信息;根据待查询用户的用户标识读取索引,获得待查询用户的相关行为信息 的存储位置;在所述存储位置中读取所述待查询用户的相关行为信息。5、 如权利要求3所述的获取方法,其特征在于,还包括按照对期望用户的要求预先设定筛选项目,从所述根据用户的标识归类 后的用户行为的语义信息中,将期望用户筛选出来。6、 一种互联网用户行为的获取系统,包括用户行为收集子系统;用户 行为收集子系统包括嵌入互联网信息资源中的收集脚本和用户行为收集服务 器;所述收集脚本用于采集用户行...

【专利技术属性】
技术研发人员:吴明辉何靖
申请(专利权)人:北京学之途网络科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1