基于社交媒体的用户隐私意识评估方法和系统技术方案

技术编号:20448837 阅读:18 留言:0更新日期:2019-02-27 02:56
本发明专利技术涉及一种基于社交媒体的用户隐私意识评估方法,通过社交媒体,提取社交用户的信息项,构建初始社交用户信息集,获取并分析该社交用户的该信息项,量化该信息项的隐私意识值并获取该信息项的评估指标权重,通过对该信息项的隐私意识值和评估指标权重加权求和,得到该社交用户的隐私意识值。本发明专利技术的方法利用社交媒体用户可访问的个人页面信息,快捷方便地计算社交用户的隐私保护意识值,对于进一步的用户隐私保护具有重要意义。

User Privacy Awareness Evaluation Method and System Based on Social Media

The present invention relates to a user privacy awareness evaluation method based on social media. Through social media, the information items of social users are extracted, the initial information set of social users is constructed, the information items of the social users are acquired and analyzed, the privacy awareness values of the information items are quantified, and the weights of the evaluation indexes of the information items are obtained. Weighted summation is used to get the privacy awareness of the social user. The method of the invention makes use of personal page information accessible by social media users to quickly and conveniently calculate the privacy protection awareness value of social users, which is of great significance for further user privacy protection.

【技术实现步骤摘要】
基于社交媒体的用户隐私意识评估方法和系统
本专利技术属于隐私保护领域,特别涉及一种用户隐私意识评估方法。
技术介绍
目前社交网站已然发展到了主要特征是实名制的第三阶段。实名制社交网站指的是用户在注册该网站的账户时,必需填写用户个人的真实信息。国内许多社交网站在努力推行实名制的社交,如知乎、人人网、微博等。实名制社交网站是以实际生活中的人际关系进行连接的社交网站。社交网站上用户提供的个人信息是真实的,所以现实生活中的人际关系可以在虚拟的社交网络上进行复制。更进一步,用户可通过社交网站提供的一些虚拟的互动操作,如评论或点赞等,加强用户在现实生活中的人际关系。用户在实名制的社交网站上可以快速找到熟人,用户之间也可以通过个人信息配对快速地找到相同特征属性的人。除此之外,通过好友推荐的方式,用户可以进一步地发展自己的朋友圈,因此,具有相同兴趣爱好的用户能够通过这样的信息传播方式联系到一起。然而,实名制社交网站在为用户带来方便的社交平台的同时,也会带来个人信息泄露的风险。社交网络进行身份实名制,会给大量用户的个人信息带来被暴露的风险,这包括用户不想被部分朋友,或者是一些陌生人所知道的敏感信息。实名制社交网站带来的隐私泄露风险,使得用户的个人隐私信息保护成为了一个迫在眉睫的难题。新浪微博平台考虑到个人信息页面可能带来隐私泄露的风险,为用户的部分重要信息提供了隐私保护设置功能,用户可以将这些极为敏感的重要信息设置为所有人可见、部分人可见、仅自己可见等隐私保护设置。通过这些隐私保护设置,可以评估用户的隐私保护意识。用户隐私保护意识的评估对于用户隐私保护问题的研究具有重要意义。经过调查研究,在现有的技术中,还没有成熟的社交媒体用户隐私意识评估相关方法,是隐私保护领域的一大空白。
技术实现思路
为解决上述问题,本专利技术提出了一种用户隐私意识评估方法,通过社交媒体,提取社交用户的信息项,构建初始社交用户信息集,获取并分析该社交用户的该信息项,量化该信息项的隐私意识值并获取该信息项的评估指标权重,通过对该信息项的隐私意识值和评估指标权重加权求和,得到该社交用户的隐私意识值。具体来说,本专利技术涉及一种基于社交媒体的用户隐私意识评估方法,包括:初始社交用户信息集构建步骤,基于社交媒体平台,获取社交用户的信息项,构建该初始社交用户集;隐私意识评估指标选取和量化步骤,分析该信息项,获取该社交用户的隐私意识评估指标,并对该信息项进行量化处理,得到该信息项的隐私意识值;评估指标权重计算步骤,获取该信息项的评估指标权重;社交用户隐私意识值计算和评估步骤,通过对该信息项的隐私意识值和评估指标权重,得到该社交用户的隐私意识值;以该隐私意识值对该社交用户的隐私意识进行评估。本专利技术所述的基于社交媒体的用户隐私意识评估方法,其初始社交用户信息集构建步骤具体包括:基于社交媒体平台,选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集。本专利技术所述的基于社交媒体的用户隐私意识评估方法,其隐私意识评估指标选取和量化步骤具体包括:分析该初始社交用户集内的信息项,抽取N个该信息项作为隐私意识评估指标,其中N为正整数;将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值。本专利技术所述的基于社交媒体的用户隐私意识评估方法,其评估指标权重计算步骤具体包括:分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重。本专利技术所述的基于社交媒体的用户隐私意识评估方法,其社交用户隐私意识值计算和评估步骤包括:对该社交用户信息项的隐私意识值通过该评估指标权重进行加权并求和,得到该社交用户的隐私意识值;该隐私意识值越大,则该用户个人信息的可见率越高,用户的隐私意识越弱;该隐私意识值越小,则该用户的个人信息可见率越低,用户的隐私意识越强。本专利技术还涉及一种基于社交媒体的用户隐私意识评估系统,该系统包括:初始社交用户信息集构建模块,用于选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集;隐私意识评估指标选取和量化模块,用于选取该社交用户的信息项成为隐私意识评估指标,并将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值;评估指标权重计算模块,用于分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重;社交用户隐私意识值计算和评估模块,社交用户隐私意识值计算和评估模块,用于对该社交用户信息项的隐私意识值,通过该评估指标权重进行加权并求和,得到该社交用户的隐私意识值;并通过该隐私意识值对该社交用户的隐私意识进行评估。本专利技术的方法有效地利用社交媒体用户可访问的个人页面信息,快捷方便地计算社交用户的隐私保护意识,对于进一步的用户隐私保护具有重要意义。附图说明图1用户隐私意识评估流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术的一种基于社交媒体的用户隐私意识评估方法进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。一、初始社交用户集构建社交媒体平台提供用户展示个人信息的页面。例如,新浪微博平台的个人信息页面可以显示用户已填的个人信息,包括用户昵称、用户的真实姓名、性别、所在地、性取向、感情状况、生日、血型、简介、联系信息、教育信息、职业信息、个人标签、个性域名和收货地址,共15项。其中,针对真实姓名、性取向、感情状况、血型、联系信息、教育信息和职业信息这7项,用户可以设置为:我关注的人可见、所有人可见、仅自己可见;针对生日这1项,用户可设置为:公开完整显示、只显示星座、只显示月日、保密。其他用户访问该用户主页时,新浪微博平台将根据这些隐私保护设置展示该用户的个人信息。本专利技术随机选择了一个种子用户,从该用户出发,按照粉丝关系爬取该用户最近的三层粉丝的个人信息页面和所有微博。经过数据预处理和关键信息提取,最终获取到大量用户的个人信息,构建为初始社交用户集。二、隐私意识评估指标选取和量化基于初始社交用户集,通过分析各个信息项的可设置特性,可知并不是每项信息都是对外可见的。社交用户的个人信息页面包括若干项个人信息项,过滤掉本身完全不可见的信息项,抽取出其中N项信息作为用户的隐私意识评估指标。通过网络爬虫能够获取用户的某项个人信息,即个人信息对网络爬虫可见,说明用户并未对个人信息进行隐私保护设置,即隐私意识薄弱。因此,对于某项个人信息,如果该项个人信息对网络爬虫可见,则该项信息的隐私意识值为1;如果该项个人信息对网络爬虫不可见,则该项信息的隐私意识值为0。在新浪微博社交平台上,针对社交用户的12项隐私意识评估指标和量化定义如下:用户填写的真实姓名;用户填写的性取向;用户填写的感情状况;用户填写的血型;用户填写本文档来自技高网
...

【技术保护点】
1.一种基于社交媒体的用户隐私意识评估方法,其特征在于,包括:初始社交用户信息集构建步骤,基于社交媒体平台,获取社交用户的信息项,构建该初始社交用户集;隐私意识评估指标选取和量化步骤,分析该信息项,获取该社交用户的隐私意识评估指标,并对该信息项进行量化处理,得到该信息项的隐私意识值;评估指标权重计算步骤,获取该信息项的评估指标权重;社交用户隐私意识值计算和评估步骤,通过对该信息项的隐私意识值和评估指标权重,得到该社交用户的隐私意识值;以该隐私意识值对该社交用户的隐私意识进行评估。

【技术特征摘要】
1.一种基于社交媒体的用户隐私意识评估方法,其特征在于,包括:初始社交用户信息集构建步骤,基于社交媒体平台,获取社交用户的信息项,构建该初始社交用户集;隐私意识评估指标选取和量化步骤,分析该信息项,获取该社交用户的隐私意识评估指标,并对该信息项进行量化处理,得到该信息项的隐私意识值;评估指标权重计算步骤,获取该信息项的评估指标权重;社交用户隐私意识值计算和评估步骤,通过对该信息项的隐私意识值和评估指标权重,得到该社交用户的隐私意识值;以该隐私意识值对该社交用户的隐私意识进行评估。2.如权利要求1所述的用户隐私意识评估方法,其特征在于,该初始社交用户信息集构建步骤具体包括:基于社交媒体平台,选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集。3.如权利要求1所述的用户隐私意识评估方法,其特征在于,该隐私意识评估指标选取和量化步骤具体包括:分析该初始社交用户集内的信息项,抽取N个该信息项作为隐私意识评估指标,其中N为正整数;将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值。4.如权利要求1所述的用户隐私意识评估方法,其特征在于,该评估指标权重计算步骤具体包括:分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重。5.如权利要求1所述的用户隐私意识评估方法,其特征在于,该社交用户隐私意识值计算和评估步骤包括:对该...

【专利技术属性】
技术研发人员:曹娟上官建峰卢名彦李锦涛
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1