The invention discloses a group relationship type recognition method and a device, belonging to the field of data mining and analysis. The group relationship type identification methods include: receiving group relationship type identification request, obtaining group information corresponding to the request, extracting the target data corresponding to each member of the group from the group information according to the predefined target data field, and composing the individual data set; input the individual data set into the group. The body classification depth neural network model, the group classification depth neural network model is trained according to the predefined target data field, and the relationship type of the group is determined according to the output of the group classification depth neural network model. The technical scheme of the invention combines the data mining analysis technology. Through the simple preprocessing operation and the group classification deep neural network model, the relationship type of the group can be identified, the manpower cost is reduced, the deployment complexity of the model is low and the model is versatile.
【技术实现步骤摘要】
群体关系类型识别方法及装置
本专利技术涉及数据挖掘分析领域,特别涉及一种群体关系类型识别方法及装置。
技术介绍
社交网络中存在着各种社交圈子,每个社交圈子集中有具有一定关联的用户成员,比如家人,公司同事,学校同学等等。在大数据时代背景下,识别社交圈子的关系类型是一个非常重要的问题,并且识别结果具有广泛的实际应用,比如大数据分析、广告投放等等。现有的技术方案或采用人工识别分类,或采用传统机器学习分类模型,需要大量的社团层面上的特征工程工作,所需要的特征包括社交圈子的成员、成员的年龄性别分布、地域分布等等。对现有技术方案的改进也局限于圈子特征提取明细的创新。现有技术至少存在以下不足:1>特征工程的完成需要大量的人力投入,且开发周期长;2>不同的圈子分类场景需要不同的特征工程工作,通用性差;3>由于涉及到大量特征处理,模型部署复杂性高;4>圈子的特征来自于对个人特征的统计,丢失了大量对提高准确率有帮助的信息。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种群体关系类型识别方法及装置,根据简单预处理操作及群体分类深度神经网络模型即可识别群体的关系类型。所述技术方案如下:一方面,本专利技术提供了一种群体关系类型识别方法,所述方法包括:接收群体关系类型识别请求;获取与所述群体关系类型识别请求相对应的群体信息,所述群体信息包括群体成员信息;根据预定义的目标数据字段,从所述群体成员信息中提取群体中每个成员对应的目标数据,组成个人数据集;将所述个人数据集输入群体分类深度神经网络模型,所述群体分类深度神经网络模型 ...
【技术保护点】
1.一种群体关系类型识别方法,其特征在于,所述方法包括:接收群体关系类型识别请求;获取与所述群体关系类型识别请求相对应的群体信息,所述群体信息包括群体成员信息;根据预定义的目标数据字段,从所述群体成员信息中提取群体中每个成员对应的目标数据,组成个人数据集;将所述个人数据集输入群体分类深度神经网络模型,所述群体分类深度神经网络模型根据所述预定义的目标数据字段训练得到;根据所述群体分类深度神经网络模型的输出结果,确定所述群体的关系类型。
【技术特征摘要】
1.一种群体关系类型识别方法,其特征在于,所述方法包括:接收群体关系类型识别请求;获取与所述群体关系类型识别请求相对应的群体信息,所述群体信息包括群体成员信息;根据预定义的目标数据字段,从所述群体成员信息中提取群体中每个成员对应的目标数据,组成个人数据集;将所述个人数据集输入群体分类深度神经网络模型,所述群体分类深度神经网络模型根据所述预定义的目标数据字段训练得到;根据所述群体分类深度神经网络模型的输出结果,确定所述群体的关系类型。2.根据权利要求1所述的方法,其特征在于,在将所述个人数据集输入群体分类深度神经网络模型之前还包括训练群体分类深度神经网络,包括:获取待训练的关系类型样本数据;对神经网络的损失函数的梯度进行学习,以最小化损失函数;通过获取关系类型样本数据中用户的目标数据字段,并根据损失函数,对所述群体分类深度神经网络进行训练,得到群体分类深度神经网络模型。3.根据权利要求2所述的方法,其特征在于,所述对神经网络的损失函数的梯度进行学习,以最小化损失函数包括:根据神经网络的所有权重和损失函数,采用反向传播法得到损失函数的梯度;根据所述梯度,采用随机梯度下降法,更新神经网络的权重;将更新的权重进行预设次数的迭代,以最小化损失函数。4.根据权利要求2所述的方法,其特征在于,所述获取待训练的关系类型样本数据包括:获取同一个群体内一个用户对另一用户的备注标签,遍历所有备注标签,将所述备注标签与预设的关系标签进行匹配,将匹配结果作为两个用户之间的打标标签;对打标标签进行分类,并统计数量最多的打标标签作为目标标签,所述目标标签映射该群体的关系类型。5.根据权利要求1-4中任意一项所述的方法,其特征在于,所述群体关系类型识别请求的触发条件包括以下条件的一个或多个:所述群体创建成功;所述群体成员数量达到触发阈值;所述群体内成员交流热度达到触发热度值;启动人工触发。6.根据权利要求4所述的方法,其特征在于,所述获取待训练的关系类型样本数据还包括筛选群体:若一个群体中数量最多的打标标签数量超过打标标签总数的一半,且具有目标标签的用户数量超过预设数量阈值,则将该群体纳入关系类型样本,否则,抛弃该群体数据。7.根据权利要求4所述的方法,其特征在于,所述预设的关系标签数量为多个,将所述备注标签与预设的关系标签进行匹配包括:针对每一个关系标签建立关键词词库,对所述备注标签进行分词,将分词结果与词库中的关键词进行比对,若分词结果与关键词匹配,则所述备注标签与该关键词所在词库所对应的关系标签匹配。8.一种群体关系类型识别装置,其特征在于,所述装置包括:请求接收模块,用于接收群体关系类型识别请求;信息获取模块,用于获取与所述群体关系类型识别请求相对应的群体信息,所述群体信息包括群体成员信息;提取模块,用于根据预定义的目标数据字段,从所述群体成员信息中提取群体中每个成员对应的目标数据,组成个人数据集;数据输入模块,用于将所述个人数据集输入群...
【专利技术属性】
技术研发人员:张宗一,张功源,张晓敏,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。