System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及社交网络数据分析,具体而言,涉及一种基于组织特征属性自适应更新的组织成员挖掘方法、介质及装置。
技术介绍
1、近些年,随着互联网技术的进步和移动互联网设备普及率的提高,组织的成员不再受到距离、地区等外界因素的限制,组织的活动也从传统的线下聚集变成了线上参与发声、各自为战,导致组织行为隐蔽且成员属性多样,给组织成员识别的准确率和识别率带来了很大的挑战。
2、目前针对目标组织成员识别的算法主要包括目标组织特征属性框架和用户属性框架构建、属性抽取与映射填充、组织特征属性和用户属性向量化表示、相似度计算、组织成员挖掘五个主要步骤。具体是:
3、1)基于专家知识制定目标组织特征属性框架和用户属性框架,确定目标组织的特征属性和组织成员属性的映射关系;
4、2)利用实体抽取技术从互联网中获取的组织相关数据中抽取组织特征属性值和相对应的用户属性值,根据组织特征属性和用户属性的映射关系;
5、3)利用特征表示技术将组织特征属性值和对应的用户属性值表示为组织特征属性向量和用户属性向量;
6、4)计算用户属性向量与目标组织特征属性向量的相似度;
7、5)根据相似度大小判定用户是否属于目标组织成员。
8、上述算法存在如下问题:
9、1、组织特征属性框架和属性值固定不变,没有考虑组织成员的动态属性,导致组织成员识别的召回率较低的问题。在实际的组织中,组织特征属性是组织固有属性和组织成员共有属性的集合,包括组织名称、组织架构、成立时间等固有属性以及
10、2、组织特征属性框架依赖专家知识,组织成员识别的准确性和召回率都比较低的问题。因为当前社交网络中的目标组织具有成员复杂、成员信息隐蔽、组织数据稀疏且完备性较低等特点,依赖专家知识制定难以制定适用性较强的组织特征属性框架,导致特征属性向量的稀疏度高、组织成员识别效果较差。
技术实现思路
1、本专利技术旨在提供一种基于组织特征属性自适应更新的组织成员挖掘方法、介质及装置,以解决上述现有算法存在的问题。
2、本专利技术提供的一种基于组织特征属性自适应更新的组织成员挖掘方法,包括如下步骤:
3、抽取组织属性和组织成员属性;
4、将抽取的组织属性和组织成员属性进行向量化表示;
5、对组织属性向量和组织成员属性向量进行属性聚类;
6、根据属性聚类结果进行组织特征属性筛选和自适应更新;
7、利用筛选的组织特征属性进行组织成员挖掘。
8、进一步的,所述抽取组织属性和组织成员属性包括:
9、首先,确定组织属性抽取框架、组织成员属性抽取框架、组织属性和成员属性的映射关系;
10、然后,按照组织属性抽取框架和组织成员属性抽取框架从互联网数据中抽取组织属性和组织成员属性对应的属性值,形成组织属性值列表和组织成员属性值列表;
11、最后,根据组织属性和成员属性的映射关系,将相关联组织属性和组织成员属性的属性值进行融合,替换各自原有的属性值。
12、进一步的,所述将抽取的组织属性和组织成员属性进行向量化表示包括:
13、根据组织属性和组织成员属性的数据类型,采用不同的特征编码方式,将组织属性和组织成员属性转化成可以用于计算的向量。
14、进一步的,所述对组织属性向量和组织成员属性向量进行属性聚类包括:
15、利用层次密度聚类算法对组织属性向量和组织成员属性向量进行聚类,得到属性聚类结果以及衡量聚类紧密程度的参数ci。
16、进一步的,所述根据属性聚类结果进行组织特征属性筛选和自适应更新包括:
17、首先,设定静态属性筛选阈值y1和动态属性筛选阈值y2,并根据参数ci的大小选择组织属性和组织成员属性,其中,ci≥y1的属性定义为静态特征属性,将y1≥ci≥y2的属性定义为动态特征属性;
18、然后,基于组织属性和组织成员属性的映射关系,剔除关联的组织属性,只保留相关联的组织成员属性,得到静态组织特征属性和动态组织特征属性集合。
19、进一步的,所述利用筛选的组织特征属性进行组织成员挖掘:
20、计算新的组织属性向量和组织特征属性之间的相似度,如果相似度大于阈值x,则该组织属性向量对应的组织成员为目标组织的成员,重复步骤3~步骤4,更新组织特征属性向量。
21、本专利技术还提供一种计算机终端存储介质,存储有计算机终端可执行指令,所述计算机终端可执行指令用于执行上述的基于组织特征属性自适应更新的组织成员挖掘方法。
22、本专利技术还提供一种计算装置,包括:
23、至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于组织特征属性自适应更新的组织成员挖掘方法。
24、综上所述,由于采用了上述技术方案,本专利技术的有益效果是:
25、本专利技术解决了传统组织特征属性框架和属性值严重依赖专家知识固定不变,没有考虑组织成员属性动态变化过程,导致组织成员识别效果差的问题,提高了组织成员挖掘的准确性和召回率。
本文档来自技高网...【技术保护点】
1.一种基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述抽取组织属性和组织成员属性包括:
3.根据权利要求2所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述将抽取的组织属性和组织成员属性进行向量化表示包括:
4.根据权利要求3所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述对组织属性向量和组织成员属性向量进行属性聚类包括:
5.根据权利要求4所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述根据属性聚类结果进行组织特征属性筛选和自适应更新包括:
6.根据权利要求5所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述利用筛选的组织特征属性进行组织成员挖掘:
7.一种计算机终端存储介质,存储有计算机终端可执行指令,其特征在于,所述计算机终端可执行指令用于执行如权利要求1-6中任一权利要求所述的基于组织特征属性自适应更新的组织成员挖
8.一种计算装置,其特征在于,包括:
...【技术特征摘要】
1.一种基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述抽取组织属性和组织成员属性包括:
3.根据权利要求2所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述将抽取的组织属性和组织成员属性进行向量化表示包括:
4.根据权利要求3所述的基于组织特征属性自适应更新的组织成员挖掘方法,其特征在于,所述对组织属性向量和组织成员属性向量进行属性聚类包括:
...
【专利技术属性】
技术研发人员:刘锟,曾曦,肖宁,郭兴文,王效武,王海兮,
申请(专利权)人:中国电子科技集团公司第三十研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。