用于企业交易关系数据的信息处理方法和装置制造方法及图纸

技术编号:31608930 阅读:59 留言:0更新日期:2021-12-29 18:36
本公开提供用于企业交易关系数据的信息处理方法和装置,该方法包括:响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业;根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集。故此,按照关联度的顺序来进行企业信息集的划分,使得企业信息集的划分更加准确,解决了现有技术中社区划分结果的准确率较低的问题。率较低的问题。率较低的问题。

【技术实现步骤摘要】
用于企业交易关系数据的信息处理方法和装置


[0001]本专利技术涉及信息处理
,特别涉及一种用于企业交易关系数据的信息处理方法和装置。

技术介绍

[0002]随着网络的迅速发展,网络中的社区结构反映了网络的分布结构,根据节点在网络中的结构信息对节点进行分类从而形成社区分组。社区中的成员通常存在许多交集,而一个成员可能在网络中有多个身份同时归属于多个社区,从而存在社区重叠的现象。例如,在企业交易关系中,不同的企业由于该企业的特殊性,会与其他不同领域的企业产生紧密的交易关系,从而同一个企业可能会属于不同企业社区。
[0003]为了能够有效的对企业进行的划分,一种典型的方式是采用社区发现算法来实现。由于现有技术中的社区发现算法在进行社区划分时,导致每次都划分出截然不同的社区,由此,导致了社区划分的准确率较低,不利于后续对划分后的社区进行分析。因此,急需一种新的方法来解决上述的问题。

技术实现思路

[0004]本公开提供一种用于企业交易关系数据的信息处理方法和装置,用于解决现有技术中社区划分准确率较低的问题。
[0005]第一方面,本公开提供一种用于企业交易关系数据的信息处理方法,所述方法包括:
[0006]响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业;
[0007]根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集。
[0008]在一个实施例中,所述根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集,包括:
[0009]根据获取的各目标企业的交易关系确定各目标企业之间的企业相似度;
[0010]将企业相似度大于第一指定值的目标企业添加到同一企业信息集中,并将企业相似度小于所述第一指定值的目标企业划分到不同的企业信息集中。
[0011]在一个实施例中,所述根据获取的各目标企业的交易关系确定各目标企业的企业相似度,包括:
[0012]若各目标企业为有向图中的各节点,所述各目标企业的交易关系为所述有向图中的向量边,则根据各企业的交易关系的余弦相似度和介数比例来确定所述各目标企业的企业相似度。
[0013]在一个实施例中,所述根据各企业的交易关系的余弦相似度和介数比例来确定所述各目标企业的企业相似度,包括:
[0014]根据以下公式确定所述企业相似度:
[0015][0016]其中,v
i
代表企业i,v
j
代表企业j;代表企业i和企业j的余弦相似度,δ为企业i和企业j的介数比例;
[0017]其中,所述企业i和企业j的介数比例根据以下公式确定:
[0018][0019]其中,σ为所述有向图中任意两企业之间最短路径的总数;σ(v
i
,v
j
)为有向图中的任意两企业之间的最短路径中包含企业i和企业j的最短路径的数量。
[0020]在一个实施例中,确定所述各企业的关联度,包括:
[0021]所述关联度与企业的指定企业数量和所述企业的邻居企业的指定企业数量的比值成正比;其中,所述指定企业数量为向所述目标企业提供产品的企业数量;
[0022]并根据以下公式确定所述关联度:
[0023][0024]其中,PR(i)为企业i的关联度,N为企业总数;d是阻尼因子,adj(i)为企业i的邻居企业所构成的集合;INi是企业i的入度,所述入度为向所述企业i提供产品的企业的数量;是企业j的邻居企业的入度总和,其中,k表示为企业j的第k个相邻企业,k∈[1,m]。
[0025]在一个实施例中,所述根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集之后,还包括:
[0026]获取各企业信息集的并集之外的企业作为待处理企业;
[0027]若所述待处理企业并入所述目标企业信息集前后,所述目标企业信息集内的企业间的交易频繁度的变化量大于第一指定值,则将所述待处理企业合并到所述目标企业信息集中。
[0028]在一个实施例中,确定所述交易频繁度,包括:
[0029]根据以下公式确定所述交易频繁度:
[0030][0031]其中,A代表并入企业信息集S的目标企业;表示企业信息集S内部各目标企业之间连接边的数量之和;表示企业信息集S内各目标企业与除企业信息集S之外的其他企业之间连接边的数量之和;α是一个指定数值;K
inner
(S,A)为目标企业A和企业信息集S内各目标企业连接边的数量总和;为目标企业A的出度和入度的总和,所述出度为向所述目标企业A购买产品的企业的数量,所述入度为向所述目标企业A提供产品的企业的数量。
[0032]在一个实施例中,所述将所述待处理企业合并到所述目标企业信息集之后,还包括:
[0033]确定各企业信息集之间的重合度;
[0034]将重合度大于第二指定值的企业信息集进行合并。
[0035]在一个实施例中,所述确定各企业信息集之间的重合度,包括:
[0036]根据以下公式计算所述重合度O:
[0037][0038]其中,C1,C2分别代表不同的企业信息集,min(|C1|,|C2|)代表企业信息集C1和企业信息集C2中企业数量较少的企业信息集。
[0039]在一个实施例中,所述响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业之前,还包括:
[0040]获取各企业交易数据;
[0041]根据各企业交易数据,得到基于企业交易关系构建的知识图谱,并存储到分布式图数据库中;
[0042]在分布式系统基础架构Hadoop平台上利用spark组件对所述知识图谱进行分布式计算,得到支持spark计算的各企业的交易关系。
[0043]第二方面,本公开提供一种用于企业交易关系数据的信息处理装置,所述装置包括:
[0044]目标企业获取模块,用于响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业;
[0045]企业信息集确定模块,用于根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集。
[0046]在一个实施例中,所述企业信息集确定模块,还用于:
[0047]根据获取的各目标企业的交易关系确定各目标企业之间的企业相似度;
[0048]将企业相似度大于第一指定值的目标企业添加到同一企业信息集中,并将企业相似度小于所述第一指定值的目标企业划分到不同的企业信息集中。
[0049]在一个实施例中,所述企业信息集确定模块,还用于:
[0050]若各目标企业为有向图中的各节点,所述各目标企业的交易关系为所述有向图中的向量边,则根据各企业的交易关系的余弦相似度和介数比例来确定所述各目标企业的企业相似度。
[0051]在一个实施例中,所述企业信息集确定模块,还用于:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于企业交易关系数据的信息处理方法,其特征在于,所述方法包括:响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业;根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集。2.根据权利要求1所述的方法,其特征在于,所述根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集,包括:根据获取的各目标企业的交易关系确定各目标企业之间的企业相似度;将企业相似度大于第一指定值的目标企业添加到同一企业信息集中,并将企业相似度小于所述第一指定值的目标企业划分到不同的企业信息集中。3.根据权利要求2所述的方法,其特征在于,所述根据获取的各目标企业的交易关系确定各目标企业的企业相似度,包括:若各目标企业为有向图中的各节点,所述各目标企业的交易关系为所述有向图中的向量边,则根据各企业的交易关系的余弦相似度和介数比例来确定所述各目标企业的企业相似度。4.根据权利要求3所述的方法,其特征在于,所述根据各企业的交易关系的余弦相似度和介数比例来确定所述各目标企业的企业相似度,包括:根据以下公式确定所述企业相似度:其中,v
i
代表企业i,v
j
代表企业j;代表企业i和企业j的余弦相似度,δ为企业i和企业j的介数比例;其中,所述企业i和企业j的介数比例根据以下公式确定:其中,σ为所述有向图中任意两企业之间最短路径的总数;σ(v
i
,v
j
)为有向图中的任意两企业之间的最短路径中包含企业i和企业j的最短路径的数量。5.根据权利要求1所述的方法,其特征在于,确定所述各企业的关联度,包括:所述关联度与企业的指定企业数量和所述企业的邻居企业的指定企业数量的比值成正比;其中,所述指定企业数量为向所述目标企业提供产品的企业数量;并根据以下公式确定所述关联度:其中,PR(i)为企业i的关联度,N为企业总数;d是阻尼因子,adj(i)为企业i的邻居企业所构成的集合;INi是企业i的入度,所述入度为向所述企业i提供产品的企业的数量;是企业j的邻居企业的入度总和,其中,k表示为企业j的第k个相邻企业,k∈[1,m]。6.根据权利要求1所述的方法,其特征在于,所述根据获取的各目标企业之间的相似度,对各目标企业进行划分得到各目标企业所属的企业信息集之后,还包括:
获取各企业信息集的并集之外的企业作为待处理企业;若所述待处理企业并入所述目标企业信息集前后,所述目标企业信息集内的企业间的交易频繁度的变化量大于第一指定值,则将所述待处理企业合并到所述目标企业信息集中。7.根据权利要求6所述的方法,其特征在于,确定所述交易频繁度,包括:根据以下公式确定所述交易频繁度:其中,A代表并入企业信息集S的目标企业;表示企业信息集S内部各目标企业之间连接边的数量之和;表示企业信息集S内各目标企业与除企业信息集S之外的其他企业之间连接边的数量之和;α是一个指定数值;K
inner
(S,A)为目标企业A和企业信息集S内各目标企业连接边的数量总和;为目标企业A的出度和入度的总和,所述出度为向所述目标企业A购买产品的企业的数量,所述入度为向所述目标企业A提供产品的企业的数量。8.根据权利要求6所述的方法,其特征在于,所述将所述待处理企业合并到所述目标企业信息集之后,还包括:确定各企业信息集之间的重合度;将重合度大于第二指定值的企业信息集进行合并。9.根据权利要求8所述的方法,其特征在于,所述确定各企业信息集之间的重合度,包括:根据以下公式计算所述重合度O:其中,C1,C2分别代表不同的企业信息集,min(|C1|,|C2|)代表企业信息集C1和企业信息集C2中企业数量较少的企业信息集。10.根据权利要求1所述的方法,其特征在于,所述响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业之前,还包括:获取各企业交易数据;根据各企业交易数据,得到基于企业交易关系构建的知识图谱,并存储到分布式图数据库中;在分布式系统基础架构Hadoop平台上利用spark组件对所述知识图谱进行分布式计算,得到支持spark计算的各企业的交易关系。11.一种用于企业交易关系数据的信息处理装置,其特征在于,所述装置包括:目标企业获取模块,用于响应于企业交易关系处理指令,按照各企业的关联度获取指定数量的目标企业;企业信息集确定模块,用于根据获取的各目标企业之间的...

【专利技术属性】
技术研发人员:刘振宇林文辉王志刚刘雅婷王泽皓闫凯
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1