基于多元回归分析的社交网络影响因子确定方法及系统技术方案

技术编号:24460317 阅读:36 留言:0更新日期:2020-06-10 16:48
本发明专利技术提供了一种基于多元回归分析的社交网络影响因子确定方法及系统,包括:建立社会网络数据库,社会网络数据库包括网络中心度数据集合、网络稳定性数据集合以及网络结构洞数据集合;获取目标影响因素数据,对目标影响因素数据进行与网络中心度数据、网络稳定性数据以及网络结构洞数据进行多元回归分析且生成第一回归模型;获取第一回归模型的回归系数,当回归系数显著时,则输出第一关联信息。在本发明专利技术中,通过将目标影响因素数据与所述社会网络数据库的数据进行回归分析,当所述回归系数显著时,则输出第一关联信息,实现社交网络中社交群体的标签添加功能,能够应用于具有创新能力的社交网络群体的以及互联网中具有创新能力社群的群体挖掘及发现。

The method and system of determining social network influence factors based on multiple regression analysis

【技术实现步骤摘要】
基于多元回归分析的社交网络影响因子确定方法及系统
本专利技术涉及网络信息技术,具体地,涉及一种基于多元回归分析的社交网络影响因子确定方法及系统。
技术介绍
在不同的行业中遍布着形态各异的社会网络,网络内部不断进行的知识交流以及协同创新,为各行业的行业发展提供动力。同时,社会网络作为协同合作的网络基础在各国经济发展历史上都产生了不可磨灭的作用。处于全球协同的今天,国家层面,我国需要坚持以全球视野谋划和推动产业合作,全方位加强国际科技合作,积极主动融入全球科技网络。企业层面,我国企业为了跟上产业发展,掌握未来发展方向除了需要坚持进行组织学习,还需要坚持不断地进行合作。因此,可以看出社会网络结构特征以及组织学习对于合作发展的重要性。在社会网络理论中,位置中心性表征的是整个网络的集中或集权程度,即整个网络围绕一个点或一组点来组织运行的程度,被当作描述整个网络的结构变量之一。网络稳定性反映的是某个网络内部节点之间关系的稳定性,稳定的合作关系利于企业之间建立长期合作关系,但是过于稳定的关系会限制企业外部知识来源,不利于企业的长期发展。网络结构洞是又一重要的个体网络结构特征,指的是两个节点之间的非冗余的关系。假设A、B、C三个节点组成一个封闭网络,若三个节点之间都有连接,此时网络是封闭的,因为任何一点都可与其他两点直接联系。现假定A、C之间没有联系,但它们都与B相连,此时,B所处的位置就是一个结构洞。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于多元回归分析的社交网络影响因子确定方法及系统。根据本专利技术提供的基于多元回归分析的社交网络影响因子确定方法,包括如下步骤:步骤S1:建立社会网络数据库,所述社会网络数据库包括网络中心度数据集合、网络稳定性数据集合以及网络结构洞数据集合;步骤S2:获取目标影响因素数据,对所述目标影响因素数据进行与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析且生成第一回归模型;步骤S3:获取所述第一回归模型的回归系数,当所述回归系数显著时,则输出第一关联信息。优选地,所述网络中心度数据集合A为:A={(famous1,time1,length1),(famous2,time2,length2),……,(famousn,timen,lengthn)},其中(famousn,timen,lengthn)中famousn表示节点n的知名度,timen表示节点n与任意节点的合作次数,lengthn表示节点n与其他节点的合作周期;网络稳定性数据集合B为B={(length1,Contract1,NewM1),(length2,Contract2,NewM2),......(lengthn,Contractn,NewMn)},其中lengthn表示节点n与任意节点的合作周期,Contractn表示节点n与任意节点签订的合作协议数量,NewM2表示与节点n预设定时间后新建立合作关系的节点数量;网络结构洞数据集合C为C={(point1,number1,value1),(point2,number2,value),……,(pointn,numbern,valuen)},其中(pointn,numbern,valuen)中pointn表示节点n的掌握任意的节点的目标信息数量,numbern表示节点n与任意节点的链接数量,valuen表示节点n掌握信息的价值。优选地,所述知名度的采用词频比例表示,具体为:其中,Rit为节点i的名称在公元t年代的词频比例,也即知名度;Cit表示节点i在公元t年出现次数,Ct为在公元t年中关于该节点在一网络数据库检索出的所有信息。优选地,还包括如下步骤:步骤N1:对利用式学习数据与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析生成第二回归模型;步骤N2:对探索式学习数据与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析生成第三回归模型;步骤N3:获取所述第二回归模型的回归系数和所述第三回归模型的回归系数,当所述第二回归模型的回归系数显著时,则输出第二关联信息,当所述第三回归模型的回归系数显著时,则输出第三关联信息。优选地,还包括如下步骤:步骤M1:对所述目标影响因素数据进行与所述利用式学习数据、所述探索式学习、数据所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析且生成第四回归模型;步骤M2:当所述第一回归模型、所述第二回归模型、所述第四回归模型的回归系数均显著时,则输出第四关联信息。优选地,所述第一回归模型为:y1=β0+β1x1+β2x2+β3x3+εβ0,β2,β3为回归参数;y1为目标影响因素数据;x1为网络中心度数据,x2为网络稳定性数据,x3为网络结构洞数据。优选地,所述第二回归模型为:y2=β4+β5x4+β6x5+β7x6+ε1所述第三回归模型为:y3=β8+β5x4+β6x5+β7x6+ε2y3=β8+β5x4+β6x5+β7x6+ε2β4,β5,β6,β7,β8为回归参数;y2为利用式学习数据;y3为探索式学习数据;x4为网络中心度数据,x5为网络稳定性数据,x6为网络结构洞数据。优选地,所述第四回归模型为:y4=β9+β10x7+β11x8+β12x9+β13x10+β14x11+ε3β9,β10,β11,β12,β13,β14为回归参数;y4为目标影响因素数据;x7为网络中心度数据,x8为网络稳定性数据,x9为网络结构洞数据;x10为利用式学习数据;x11为探索式学习数据。本专利技术提供的基于多元回归分析的社交网络影响因子确定系统,包括如下步骤:数据库模块,用于建立社会网络数据库,所述社会网络数据库包括网络中心度数据集合、网络稳定性数据集合以及网络结构洞数据集合;回归分析模块,用于获取目标影响因素数据,对所述目标影响因素数据进行与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析且生成第一回归模型;信息输出模块,用于获取所述第一回归模型的回归系数,当所述回归系数显著时,则输出第一关联信息。与现有技术相比,本专利技术具有如下的有益效果:在本专利技术中,通过将目标影响因素数据与所述社会网络数据库的数据进行回归分析,当所述回归系数显著时,则输出第一关联信息,实现社交网络中社交群体的标签添加功能,能够应用于具有创新能力的社交网络群体的以及互联网中具有创新能力社群的群体挖掘及发现。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术实施例中基于多元回归分析的社交网络影响因子确定方法的步骤流程图;图2为本专利技术实施例中双元性学习与社会网络数据的回归分析的步骤流程图;本文档来自技高网...

【技术保护点】
1.一种基于多元回归分析的社交网络影响因子确定方法,其特征在于,包括如下步骤:/n步骤S1:建立社会网络数据库,所述社会网络数据库包括网络中心度数据集合、网络稳定性数据集合以及网络结构洞数据集合;/n步骤S2:获取目标影响因素数据,对所述目标影响因素数据进行与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析且生成第一回归模型;/n步骤S3:获取所述第一回归模型的回归系数,当所述回归系数显著时,则输出第一关联信息。/n

【技术特征摘要】
1.一种基于多元回归分析的社交网络影响因子确定方法,其特征在于,包括如下步骤:
步骤S1:建立社会网络数据库,所述社会网络数据库包括网络中心度数据集合、网络稳定性数据集合以及网络结构洞数据集合;
步骤S2:获取目标影响因素数据,对所述目标影响因素数据进行与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析且生成第一回归模型;
步骤S3:获取所述第一回归模型的回归系数,当所述回归系数显著时,则输出第一关联信息。


2.根据权利要求1所述的基于多元回归分析的社交网络影响因子确定方法,其特征在于,
所述网络中心度数据集合A为:
A={(famous1,time1,length1),(famous2,time2,length2),……,(famousn,timen,lengthn)},其中(famousn,timen,lengthn)中famousn表示节点n的知名度,timen表示节点n与任意节点的合作次数,lengthn表示节点n与其他节点的合作周期;
网络稳定性数据集合B为
B={(length1,Contract1,NewM1),(length2,Contract2,NewM2),......(lengthn,Contractn,NewMn)},其中lengthn表示节点n与任意节点的合作周期,Contractn表示节点n与任意节点签订的合作协议数量,NewM2表示与节点n预设定时间后新建立合作关系的节点数量;
网络结构洞数据集合C为
C={(point1,number1,value1),(point2,number2,value),……,(pointn,numbern,valuen)},其中(pointn,numbern,valuen)中pointn表示节点n的掌握任意的节点的目标信息数量,numbern表示节点n与任意节点的链接数量,valuen表示节点n掌握信息的价值。


3.根据权利要求2所述的基于多元回归分析的社交网络影响因子确定方法,其特征在于,所述知名度的采用词频比例表示,具体为:



其中,Rit为节点i的名称在公元t年代的词频比例,也即知名度;Cit表示节点i在公元t年出现次数,Ct为在公元t年中关于该节点在一网络数据库检索出的所有信息。


4.根据权利要求1所述的基于多元回归分析的社交网络影响因子确定方法,其特征在于,还包括如下步骤:
步骤N1:对利用式学习数据与所述网络中心度数据、所述网络稳定性数据以及网络结构洞数据进行多元回归分析生成第二回归模型;
步骤N2:对探索式学习数据与所述网络中心度数据、所述网络稳定...

【专利技术属性】
技术研发人员:张金福黄雪晴邓链
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1