基于图谱的家庭关系识别方法及系统技术方案

技术编号:36694972 阅读:26 留言:0更新日期:2023-02-27 20:06
本发明专利技术涉及一种基于图谱挖掘的家庭关系识别方法,所述方法包括以下步骤:根据宽带数据或固网数据提取家庭群体数据;根据通话数据构建通话关系图谱G,其中G=(V、E),V节点代表用户群体,用户v

【技术实现步骤摘要】
基于图谱的家庭关系识别方法及系统


[0001]本专利技术是关于一种基于图谱的家庭关系识别方法、设备及计算机可读存储介质。

技术介绍

[0002]随着移动通信市场的不断完善,国内电信业全业务竞争已经展开,运营商正面临着日益加剧的竞争压力。然而,在固移融合等业务的发展下,家庭市场将是运营商新的角逐点和增益点,家庭业务已成为运营商重点竞争的业务之一。
[0003]家庭关系识别的当前技术方法主要分为两类:基于宽带数据和基于通话关系的方法。基于宽带数据的方法,分析固网信令数据,将连接同一WIFI下的用户数据提取出来作为一个家庭群体。然而,基于通话关系的方法通常先加阈值限制,去掉骚扰或者推销的无关记录,再采用聚类方法,将可能的家庭群体聚在一起。
[0004]基于宽带数据的方法只能识别出使用自己宽带业务的家庭用户,而随着微信和QQ等网络通信工具的广泛应用,人们之间的通话次数变少,阈值限制去掉骚扰或者推销的方法极有可能会删去这些通话次数少的真实家庭关系。此外,聚类这种无监督模型因没有真实类标参与训练,关系的识别准确度不会很高
专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图谱的家庭关系识别方法,其特征在于,所述方法包括以下步骤:根据宽带数据或固网数据提取家庭群体数据;根据通话数据构建通话关系图谱G,其中G=(V、E),V节点代表用户群体,E代表通话关系;基于所述通话关系图谱G表示用户节点特征N;根据通话关系图谱G训练训练多层感知机模型,其中任选两个用户节点(i、j)的节点特征(N
i
、N
j
)和两个用户节点(i、j)间的通话次数C拼接到一个向量表示中,从而输出类别L值,其中L为0或1、0代表用户间无关系,1代表用户有关系;根据输出结果对多层感知机模型的模型参数进行调优。2.根据权利要求1所述的方法,其特征在于,通过用户宽带的办理信息确定当前宽带的户主信息,再基于hadoop框架、DPI宽带网络深度包检测技术和爬虫等技术,从根据宽带数据或固网数据中解析数据。3.根据权利要求2所述的方法,其特征在于,清洗过滤数据中的非http和非radius协议数据包,对http数据包进行报文解析,匹配、提取报文中的多个用户手机号码,同一用户群体提取的手机号便可视为同一家庭群体。4.根据权利要求1所述的方法,其特征在于,从通话系统中所有用户的通话详单中获取用户间的通话记录,构建通话关系图谱G=(V、E),其中,V节点代表用户群体,用户v
i
或用户v
j
的手机号作为节点唯一标识,节点特征信息包含:用户性别、用户年龄、出生日期、套餐编码、流量使用信息、通话时长和信用等级等,E代表通话关系,即代表记录中两个用户是否有通话。5.根据权利要求1所述的方法,其特征在于,基于通话关系图谱G,采用node2vec方法,表示图中的每个节点特征,通过Node2vec技术,将节点vi表示为Ni,其中N的维度设定为32,N
i
=Node2vec(v
i
)。6.根据权利要求1所述的方法,其特征在于,所述多层感知机模型包括输入层X
in
、第一层隐藏层H1、第二层隐藏层H2和输出层y
net
,其中,第一层隐含层H1神经元数量为...

【专利技术属性】
技术研发人员:汪悦高伟王天翼程新洲翟立柱王思维谢志普李鹏飞
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1