一种从社交网络抽取MSVL模型的方法技术

技术编号:14342215 阅读:57 留言:0更新日期:2017-01-04 14:03
本发明专利技术公开了一种从社交网络抽取MSVL模型的方法,所述从社交网络抽取MSVL模型的方法包括:通过网络爬虫或现有SNS数据包来获取感兴趣的SNS系统的数据信息;将获得的SNS系统信息进行分析,转化为统一的XML格式;将提取到的XML格式的SNS数据转化成MSVL程序,用形式化建模语言MSVL实现对SNS系统的建模。本发明专利技术对真实的SNS数据(网络爬虫获取或现有SNS数据包)进行分析,提取,转化为统一的XML格式,将XML文件当作中间层,屏蔽各种各样SNS数据格式对转化为形式化建模语言MSVL的影响。

【技术实现步骤摘要】

本专利技术属于系统形式化建模
,尤其涉及一种从社交网络抽取MSVL模型的方法
技术介绍
随着计算机科学的不断发展,全球化进程的不断加深。人与人之间的联系越来越紧密,而交往成本也在不断变低。社交网络(SocialNetworkService/Site,SNS)的出现就是这种时代潮流下的产物。SNS的产生拓宽了人们现有的交流模式,成为人们生活与工作不可缺少的一部分。典型的SNS有国外的Facebook、Twitter、YouTube、Linkedin等,国内的微信、QQ空间、百度贴吧、人人网、新浪微博、优酷网等。在社交网络领域,关于社交网络建模方面的研究有以下几种方法:意大利学者提出了一种基于图的建模方法来对SNS进行建模,主要方法是通过一些著名在线社交网络平台例如Facebook、Twitter、Google+和Diaspora的分析,抽象出社交网络最主要的共有特性。用这些特性来表现各种现实世界的服务。作者把在线社交网络平台简化为用户和对象(包括文字信息,声音,视频等)以及关联的集合。特点是其引入了基于图的形式化定义,在图中用户和对象用结点表示,而用户和用户、用户和对象以及对象之间的联系用边来表示,构建的模型直观,易懂。PrT(Predicate/Transition)网是一种适用于对社交网络进行建模的高级Petri网,有高效的可达分析。这种建模方法能够严格地分析社交网络活动,可用于建模和分析在社交网络中的好友推荐功能。其特点是在传统Petri网模型的基础上引入动态通信通道,使得用户之间可以通信,并能够模块化和封装社交网络中的每个实体。美国科罗拉多州立大学的学者提出了一种建模方法,主要方法是通过对典型OSN(OnlineSocialNetwork)系统的分析,提取它们共有的特点,用以描述OSN中的各种实体和关系,这些不同的实体有:User,Subject,Group,Application,Object和Operation。任意一个实体和关系集有一个描述其属性的集合,然后用形式化建模语言Alloy来对SNS进行建模。其特点是可以表达社交网络模型的复杂结构约束和行为。中国台湾中央研究院的学者提出了一种基于拓扑的社交网络模型,用于研究社交网络的聚类系数。该模型是一种从拓扑角度建模的BA模型(Barabási-AlbertModel,一种无标度网络模型),可以把SNS用户看作是一个个的节点,用户间存在的关系看作边。其特点是网络规模可扩展,节点采用优先连接机制。现有技术存在的问题是其建模过程是通过对典型社交网络进行综合分析后进行的,是以多个现有的典型社交网站共有特性为依据的;然而每个社交网站都有自己的特点,忽略了各个社交网站的特性。
技术实现思路
本专利技术的目的在于提供一种从社交网络抽取MSVL模型的方法,旨在解决现有的社交网络建模方法无法实现针对不同的社交网站的特点进行建模的问题。本专利技术是这样实现的,一种从社交网络抽取MSVL模型的方法,所述从社交网络抽取MSVL模型的方法包括:通过网络爬虫或现有SNS数据包来获取感兴趣的SNS系统的数据信息;将获得的SNS系统信息进行分析,了解该社交网站的基本架构,还有其包含的主要数据结构和方法,如用户,内容,转发内容,好友关系等。将其转化为统一的XML格式,是将获取的数据作为输入,通过程序来分析输入的数据将其转化为对应的XML文件;将提取到的XML格式的SNS数据转化成MSVL程序,通过识别XML文件中的标签将其转化为MSVL程序中对应的数据结构,其中若该标签的结构复杂,含有子标签,那么其对应MSVL程序中的结构体,若只是XML文件中的基本类型则对应MSVL程序中的基本数据结构。用形式化建模语言MSVL实现对SNS系统的建模;在MSVL中用结构体数据类型来描述系统中的用户、用户发布的内容,用户转发的内容,用户所在位置,并采用链表表示用户的好友列表。系统中的用户用结构体structuser表示;系统中用户发布的内容用结构体structcontent表示;系统中用户转发的内容用结构体structre_content表示;系统中用户的位置用结构体structlocation表示;系统中用户的好友列表用结构体structfri表示。进一步,所述将获取的SNS数据转化成XML文件,XML文件用XMLSchema定成统一的格式;以XML文件作为中间层来连接SNS数据和形式化编程语言MSVL,进行SNS系统建模。采用XML文件作为中间层来连接SNS数据和形式化编程语言MSVL。进一步,所述将转化好的XML文件通过工具转成化建MSVL程序,进行对社交网络MSVL模型的抽取,在MSVL中用结构体数据类型来描述系统中的用户、用户发布的内容,用户转发的内容,用户所在位置,并采用链表表示用户的好友列表。本专利技术的另一目的在于提供一种应用从社交网络抽取MSVL模型的方法的分析社交网络中隐私策略的方法。本专利技术的另一目的在于提供一种应用从社交网络抽取MSVL模型的方法的分析社交网络中安全的方法。本专利技术提供的从社交网络抽取MSVL模型的方法,对真实的SNS数据(网络爬虫获取或现有SNS数据包)进行分析,提取,转化为统一的XML格式,将XML文件当作中间层,屏蔽各种各样SNS数据格式对转化为形式化建模语言MSVL的影响因为网络爬虫和数据包获取的数据格式多样,倘若直接根据获取的数据进行建模,那么对多个数据网站进行建模需要编写多个该数据格式的文件到MSVL程序转换的工具。本专利技术采用XML文件作为中间层来连接SNS数据和形式化编程语言MSVL。屏蔽了网络爬虫和数据包获取的数据格式不一致对建模产生的影响,只需要开发一个从统一格式的XML文件到MSVL程序的转换工具既可;将XML文件转化为MSVL语言进行对社交网络系统建模。其实现方法是使用了XML格式的数据文件作为中间层,用来屏蔽各种不同格式的SNS数据对转换成形式化建模语言MSVL产生的影响,然后让可以把感兴趣的SNS系统数据转换成MSVL语言,从而在社交网络中抽取一个MSVL模型。在MSVL中用结构体数据类型来描述系统中的用户、用户发布的内容,用户转发的内容,用户所在位置,并采用链表表示用户的好友列表。其技术效果是使得XML文件转换为形式化建模语言MSVL,从而可以完成对社交网络的建模过程。附图说明图1是本专利技术实施例提供的从社交网络抽取MSVL模型的方法流程图。图2是本专利技术实施例提供的实施例1的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。下面结合附图对本专利技术的应用原理作详细的步描述。如图1所示,本专利技术实施例的从社交网络抽取MSVL模型的方法包括以下步骤:S101:通过网络爬虫或现有SNS数据包来获取感兴趣的SNS系统的数据信息;S102:将获得的SNS系统信息进行分析,提取感兴趣的部分,转化为统一的XML格式,以便下一步转化成形式语言;S103:将提取到的XML格式的SNS数据转化成MSVL程序,实现对SNS的建模。下面结合具体应用实施例对本专利技术的应用原理作进一步的描述。本专利技术的实施例是以现有的的新浪微博数本文档来自技高网
...
一种从社交网络抽取MSVL模型的方法

【技术保护点】
一种从社交网络抽取MSVL模型的方法,其特征在于,所述从社交网络抽取MSVL模型的方法包括:通过网络爬虫或现有SNS数据包来获取感兴趣的SNS系统的数据信息;将获得的SNS系统信息进行分析,转化为统一的XML格式;将提取到的XML格式的SNS数据转化成MSVL程序,用形式化建模语言MSVL实现对SNS系统的建模。

【技术特征摘要】
1.一种从社交网络抽取MSVL模型的方法,其特征在于,所述从社交网络抽取MSVL模型的方法包括:通过网络爬虫或现有SNS数据包来获取感兴趣的SNS系统的数据信息;将获得的SNS系统信息进行分析,转化为统一的XML格式;将提取到的XML格式的SNS数据转化成MSVL程序,用形式化建模语言MSVL实现对SNS系统的建模。2.如权利要求1所述的从社交网络抽取MSVL模型的方法,其特征在于,所述将获取的SNS数据转化成XML文件,通过XMLSchema定义需要的XML文件格式,将获取的SNS数据转换成XML文件,XMLSchema验证XML文件格式是否统一;以XML文件作为中间层来连接SNS数据和形式化编程语言MSVL,进行SNS系统建模。3.如权利要求1所述的从社交网络抽取MSVL模型的方法,其特征在于,所述将转化好的XML文件通过工具转成化建MSVL程序,进行对社交网络MSVL模型的抽取,在MSVL...

【专利技术属性】
技术研发人员:王小兵薛怡娜段振华赵亮田聪张南
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1