当前位置: 首页 > 专利查询>同济大学专利>正文

基于用户行为的隐私保护机制研究制造技术

技术编号:20222055 阅读:21 留言:0更新日期:2019-01-28 20:28
基于用户行为的隐私保护机制研究。移动互联网技术正在发展,社交网络逐渐成为人们日常生活重要的一部分。用户在各类社交网络平台上公开个人信息和分享实时动态的同时,也带来了隐私泄露的风险。用户需要一种隐私保护机制,来更加有效地保护用户在移动社交平台上的个人信息不被滥用。本发明专利技术针对了当前的隐私保护方法不能很好保护移动互联网中用户隐私数据的问题,结合移动互联网环境下用户行为的特点,提出了移动互联网中基于用户行为的隐私保护机制并将其应用于移动社交APP中,从而为用户提供更好的数据保护,降低隐私泄露的风险,提高移动互联网的服务质量。

【技术实现步骤摘要】
基于用户行为的隐私保护机制研究
本专利技术涉及互联网领域,具体涉及基于用户行为的隐私保护机制。
技术介绍
近年来随着移动互联网技术的不断发展,社交网络的用户数量呈现了持续增长的趋势。国内的微博、贴吧、豆瓣等社交网络平台都具有十分庞大的规模。2017年Q3微博财报数据显示,截至2017年9月,微博月活跃用户达到了3.76亿。用户在各大社交平台发布的各种形式的内容不计其数,与此同时,社交网络的用户之间也会发生大量的交互行为。社交网络在改变人们生活方式的同时,也面临着保护用户隐私安全的问题。用户在注册社交网络账户的时候,往往需要提供个人资料,其中包括姓名、电话、家庭住址、电子邮件等敏感信息。与此同时,用户在社交网络平台上分享的各种文字、图片和地理位置等也包含大量的个人隐私。一旦这些信息发生泄漏,用户可能会面临短信、电话和垃圾邮件的骚扰,甚至可能会遭遇欺诈、身份冒用和网络钓鱼等危险。尽管当前的社交网络中都提供与隐私相关的设置,但由于用户普遍缺乏安全意识,且隐私设置通常较为繁琐,因而大部分用户都选择了默认的隐私设置。社交网络作为人际交往和信息共享的平台,其默认的隐私设置具有很大程度的开放性,并不能满足用户的隐私保护需求。因此如何在社交网络系统中构建有效的隐私保护机制,成为了学者们关注的热点问题。
技术实现思路
本专利技术给出以下技术方案实现:具体研究内容包括:研究移动互联网中现有隐私保护方法的特点,阐述当前环境下用户信息结构,通过系统有效的对移动互联网环境下用户行为的分析与特征提取,将用户信息划分为个人信息、社交关系与行为信息,构建访问控制模型。通过爬虫爬取到公开数据并进行预处理与特征分析,随后搭建用户信任值计算模型,包括基于用户基本信息的信任值初始化、基于K-means聚类的异常时间检测、基于PageRank的用户关系分析、内容相似度分析和遗忘曲线信任值更新。在此基础上,引入时间与事件更新驱动机制,对用户信任值进行维护,实现了完整的从用户信息到访问安全等级的映射,有效的保护了用户的隐私安全。本专利技术研究方法,其特征在于,针对移动互联网中用户信息结构的特性,将源数据进行数据预处理与特征分析后用于建立访问控制模型,实现对用户信任值的初始化与计算;然后,通过对用户行为的分析并引入遗忘曲线对用户信任值进行更新,最终建立移动互联网中基于用户行为的访问控制模型。移动互联网中基于用户行为的访问控制模型,具体方法包括如下步骤:步骤1..基于微博用户数据的信任值初始化;步骤2.基于Ebbinghaus遗忘曲线的用户信任值更新;有益效果本专利技术目的在于公开一种保护用户隐私不被其它用户侵犯的基于用户行为的隐私保护模型。针对当前的隐私保护方法不能很好保护移动互联网中用户隐私数据的问题,结合移动互联网环境下用户行为的特点,提出了基于用户基本信息的信任值初始化,基于K-means聚类的异常时间检测,基于PageRank的用户关系分析,基于Levenshtein距离的内容相似度分析。基于Ebbinghaus遗忘曲线的信任值更新共同构成的移动互联网中基于用户行为的隐私保护机制,并将其应用于移动社交APP中,从而为用户提供更好的数据保护,降低隐私泄露的风险,提高移动互联网的服务质量。本专利技术针对了当前的隐私保护方法不能很好保护移动互联网中用户隐私数据的问题,结合移动互联网环境下用户行为的特点,提出了移动互联网中基于用户行为的隐私保护机制通过直接识别不安全的用户,采用限制措施保护消息发布者的安全。使用信任值初始化,位置聚类,时间聚类,PageRank计算等方式,利用已有数据构建模型。加入时间与事件更新驱动,实现从用户信息到访问安全等级的映射,总体上有效的保护了用户的隐私安全。附图说明图1模型整体框架图2用户信任值构成图3基于K-means聚类以及最优分割的异常时间检测图4为本专利技术方法流程图具体实施方式本专利技术的具体实施过程如图1至图4所示,包括如下5个方面:①基于微博用户数据的信任值初始化(1)基于用户基本信息的信任值初始化移动网络环境中的用户行为信息主要包括移动网络环境下的用户信息和移动网络环境下的行为信息。其中,用户信息是对用户静态属性的表述,行为信息则是对用户的一系列动态操作的表述。而用户信息又包括了用户的个人资料信息和用户之间的好友关系。用户的个人信息主要包括用户的一些基本信息,例如姓名、性别、出生日期、昵称、所在地、个人简介等。用户的每个属性信息都可以看成是二维平面的一个点,纵轴是不可变的属性,包括出生日期、姓名、性别等。横轴是可变的用户属性,包括所在地、年龄、昵称、关注用户数、被关注用户数、是否认证等。因为当前所在地会随着用户居住地的变化而变化,年龄会随着时间变化,关注用户数与被关注用户数则是基于用户的操作动态变化的。好友关系是一个巨大的带权有向图,用户之间的好友关系显然也是考虑用户是否值得信任的一个重要考虑环节。用户行为信息指用户一系列操作的集合,包含了时间,地点,内容等维度,我们希望模型能够对用户行为进行及时的反馈从而更新用户信任值。在进行数据获取的过程中,我们很明显的能够发现,每个用户个人信息的完整程度是不一样的,通过给不同的个人信息项不同的权重,我们计算得出用户个人信息完整度。具体数学公式如下,设每个用户的初始信任值为D(ui),不同属性为q(ei),并且不同属性的权重为qi,则D(ui)与其余各项的计算过程如下:(2)基于K-means聚类以及最优分割的异常时间检测在对于用户登录行为的异常检测过程中,我们注意到,用户日常使用APP的时间段是有规律的,这种规律能够在一定程度上帮助我们判断一个用户是否在自己的常用时间段登录。首先,我们将每个用户各自的微博发布时间汇总,对每个用户的微博时间数据使用K-means算法进行聚类,已知观测集(x1,x2,x3,…,xn),其中每个观测都是一个用户个人所有微博行为的数据,k-平均聚类要把这n个观测划分到k个集合中(k≤n),使得组内平方和(WCSSwithin-clustersumofsquares)最小。换句话说,它的目标是找到使得下式满足的聚类Si,其中μi是Si中所有点的均值。这里我们对于聚类类别分别用3、4、5类进行了实验,最终发现聚类类别数为3的时候聚类效果最好,同时也最符合人们的日常APP使用习惯。每个人的日常使用微博时间无非三个时间点,午休时间,晚饭后的一段时间,以及睡觉前的一段时间,可能每个人的时间略有偏差,但是大致的时间段差不多是分布在三个区间中。故我们将每个用户的微博时间数据进行聚类,就能够得到每个用户的三个发布微博的时间中心。之后将用户的所有微博数据与三个时间中心计算差异值,这里我们的差异值D采用的计算公式如下所示,假设三个中心点的坐标分别为C1,C2,C3这里采用倒数相加求和的方式是因为我们需要保证当一个用户的某次微博发布行为严重偏离三个中心位置时,所得出的差异值会异常的大,而分母的分母中的0.01是为了防止某个点与聚类中心想重合导致的除零问题。计算完每个用户的差异值的集合之后,我们将所有用户的所有差异值汇总。由于一天中只有24个小时,而我们的数据也是计算过差异的数据,已经将一天中发布时间的特征消除,所以剩下的数据具有一个共性,那就是当用户的某次行为接近自身的三个中心点本文档来自技高网...

【技术保护点】
1.基于用户行为的隐私保护机制研究,其特征在于,确定当前环境下用户信息结构,对移动互联网环境下用户行为的分析与特征提取,将用户信息划分为个人信息、社交关系与行为信息,构建访问控制模型;通过爬虫爬取到公开数据并进行预处理与特征分析,随后搭建用户信任值计算模型,包括基于用户基本信息的信任值初始化、基于K‑means聚类的异常时间检测、基于PageRank的用户关系分析、内容相似度分析和遗忘曲线信任值更新;在此基础上,引入时间与事件更新驱动机制,对用户信任值进行维护,实现了完整的从用户信息到访问安全等级的映射,保护用户的隐私安全。

【技术特征摘要】
1.基于用户行为的隐私保护机制研究,其特征在于,确定当前环境下用户信息结构,对移动互联网环境下用户行为的分析与特征提取,将用户信息划分为个人信息、社交关系与行为信息,构建访问控制模型;通过爬虫爬取到公开数据并进行预处理与特征分析,随后搭建用户信任值计算模型,包括基于用户基本信息的信任值初始化、基于K-means聚类的异常时间检测、基于PageRank的用户关系分析、内容相似度分析和遗忘曲线信任值更新;在此基础上,引入时间与事件更新驱动机制,对用户信任值进行维护,实现了完整的从用户信息到访问安全等级的映射,保护用户的隐私安全。2.如权利要求1所述的基于用户行为的隐私保护机制研究,其特征在于,所述基于微博用户数据的信任值初始化,具体为:基于用户基本信息的信任值初始化;基于K-means聚类的异常时间检测;基于PageRank的用户关系分析;基于Levenshtein距离的内容相似度分析。3.如权利要求1所述的基于用户行为的隐私保护机制研究,其特征在于,所述基于用户基本信息的信任值初始化,移动网络环境中的用户行为信息主要包括移动网络环境下的用户信息和移动网络环境下的行为信息;其中,用户信息是对用户静态属性的表述,行为信息则是对用户的一系列动态操作的表述;而用户信息又包括了用户的个人资料信息和用户之间的好友关系。4.如权利要求3所述的基于用户行为的隐私保护机制研究,其特征在于,用户的个人信息主要包括用户的一些基本信息,例如姓名、性别、出生日期、昵称、所在地、个人简介等;用户的每个属性信息都可以看成是二维平面的一个点,纵轴是不可变的属性,包括出生日期、姓名、性别等;横轴是可变的用户属性,包括所在地、年龄、昵称、关注用户数、被关注用户数、是否认证等;因为当前所在地会随着用户居住地的变化而变化,年龄会随着时间变化,关注用户数与被关注用户数则是基于用户的操作动态变化的。5.如权利要求3所述的基于用户行为的隐私保护机制研究,其特征在于,好友关系是一个巨大的带权有向图,用户之间的好友关系显然也是考虑用户是否值得信任的一个重要考虑环节。6.如权利要求3所述的基于用户行为的隐私保护机制研究,其特征在于,通过给不同的个人信息项不同的权重,计算得出用户个人信息完整度;具体数学公式如下,设每个用户的初始信任值为D(ui),不同属性为q(ei),并且不同属性的权重为qi,则D(ui)与其余各项的计算过程如下:7.如权利要求1所述的基于用户行为的隐私保护机制研究,其特征在于,所述基于K-means聚类以及最优分割的异常时间检测:在对于用户登录行为的异常检测过程中,用户日常使用APP的时间段是有规律的,这种规律用于判断一个用户是否在自己的常用时间段登录;首先,将每个用户各自的微博发布时间汇总,对每个用户的微博时间数据使用K-means算法进行聚类,已知观测集(x1,x2,x3,…,xn),其中每个观测都是一个用户个人所有微博行为的数据,k-平均聚类要把这n个观测划分到k个集合中(k≤n),使得组内平方和(WCSSwithin-clustersumofsquares...

【专利技术属性】
技术研发人员:张斯杰吴昆张伯阳程久军
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1