一种对在线社交网络用户进行结构化属性推断的方法技术

技术编号：16176162 阅读：43 留言：0更新日期：2017-09-09 03:26

本发明专利技术公开了一种对在线社交网络用户进行结构化属性推断的方法，将用户的多个属性编码为结构化的组合属性类别向量，通过在用户节点关系图G中进行权重化的随机游走获取用户节点序列集，然后利用词转向量工具Word2Vec生成每个用户节点的实数值向量表示；构建一个的全连接神经网络模型进行训练。在用户属性推断时，将需要推断属性的用户节点向量表示输入到训练好的神经网络模型中，计算得出每个组合属性类别向量的概率，取概率最大的为该用户的组合属性类别。本发明专利技术只需提取部分用户的属性信息以及用户间的好友关系(或关注关系)，无需获取额外的用户行为特征数据；同时，所提出的方法充分利用属性之间内在联系，提高了属性推断的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种对在线社交网络用户进行结构化属性推断的方法
本专利技术属于网络信息
，更为具体地讲，涉及一种对在线社交网络用户进行结构化属性推断的方法。
技术介绍
属性推断是用来自动预测在线社交网络中用户的未知属性和潜在特质的主要技术手段，可应用于市场分析中定义不同的客户类型，深度挖掘用户属性信息以优化个性化的推荐方法，同时针对可能的用户属性推断攻击采取相应的保护措施。如推测用户的年龄、性别、地理位置、兴趣、职业等，这些信息可用于商品推荐、资讯推荐。已有属性推断方法提取的特征包括用户本身的个人信息如性别、年龄、职业、教育水平，以及用户的行为信息如浏览的网页、共享的位置、购买的商品数据等。然而由于涉及个人隐私，提取的用户个人信息往往存在不真实不全面的问题；用户行为信息(特征数据)大多数也不容易获取，且需耗费大量的时间和资源。此外，已有属性推断采取多个属性分别预测的方法，忽视了属性之间本身存在的相关性质，因此已有属性推断方法效率低且准确性不高。同时，已有属性推断方法的思路是利用用户的行为特征相似，进而推断用户属性存在相同的趋势，通过提取用户行为特征进行用户建模，从而设计算法进行单个属性推断。尽管已有属性推断方法完成了属性推断的任务，但其所需的输入信息较多，且难以避免不真实的用户信息对属性推断结果的影响，故而属性推断的可移植性不高。
技术实现思路
本专利技术的目的在于克服现有属性推断的不足，提出一种对在线社交网络用户进行结构化属性推断的方法，以提高属性推断的效率和准确性，并避免不真实的用户信息对属性推断结果的影响，改善属性推断的可移植性。为实现上述专利技术目的，本专利技术...

【技术保护点】
一种对在线社交网络用户进行结构化属性推断的方法，其特征在于，包括以下步骤：(1)、确定在线社交网络根据需求，确定一个需要进行用户属性推断的在线社交网络(OSN)，且该在线社交网络中用户的每个属性即用户属性Atti只有一个值，其中，i为用户属性编号；(2)、选取部分已知用户属性的用户，构建其0‑1组合属性类别向量2.1)、将用户属性规范为I个，对于用户的第i个属性Atti，统计其属性值个数Ni，并构建只有一个位置为1的、元素个数为Ni的0‑1形式向量：0‑1形式向量的每一位对应一个属性值，如果已知用户属性的用户，其第i个属性Atti属于某一个属性值，则0‑1形式向量中对应属性值位为1；2.2)、将已知用户属性用户的所有属性Atti对应的0‑1形式向量组合在一起，形成一个结构化属性向量；2.3)、构建一个映射表：映射表的索引为结构化属性向量所有可能的取值，映射值为只有一个位置为1的、元素个数为D的0‑1组合属性类别向量，D为结构化属性向量所有可能的取值数量，索引与映射值一一对应；已知用户属性用户的结构化属性向量，根据其取值，查找映射表，得到其对应的0‑1组合属性类别向量Vec_tk，其中，...

【技术特征摘要】
1.一种对在线社交网络用户进行结构化属性推断的方法，其特征在于，包括以下步骤：(1)、确定在线社交网络根据需求，确定一个需要进行用户属性推断的在线社交网络(OSN)，且该在线社交网络中用户的每个属性即用户属性Atti只有一个值，其中，i为用户属性编号；(2)、选取部分已知用户属性的用户，构建其0-1组合属性类别向量2.1)、将用户属性规范为I个，对于用户的第i个属性Atti，统计其属性值个数Ni，并构建只有一个位置为1的、元素个数为Ni的0-1形式向量：0-1形式向量的每一位对应一个属性值，如果已知用户属性的用户，其第i个属性Atti属于某一个属性值，则0-1形式向量中对应属性值位为1；2.2)、将已知用户属性用户的所有属性Atti对应的0-1形式向量组合在一起，形成一个结构化属性向量；2.3)、构建一个映射表：映射表的索引为结构化属性向量所有可能的取值，映射值为只有一个位置为1的、元素个数为D的0-1组合属性类别向量，D为结构化属性向量所有可能的取值数量，索引与映射值一一对应；已知用户属性用户的结构化属性向量，根据其取值，查找映射表，得到其对应的0-1组合属性类别向量Vec_tk，其中，k为已知用户属性用户的编号，k＝1,2,...,K，K为已知用户属性用户的数量；(3)、权重化随机游走，获取用户节点序列集WalkList将在线社交网络中用户间存在的好友关系表示为由代表用户的节点集V和代表用户间好友关系的边集E组成的无向图即用户节点关系图G；对用户节点关系图G中所有节点进行遍历，得到在线社交网络OSN的用户节点序列集WalkList：3.1)、对于在线社交网络OSN，初始化节点之间的权重为1；3.2)、第一趟遍历用户节点关系图G中的所有节点时，依次选择一个节点作为开始节点进行权重修改的随机游走，游走时从开始节点或到达节点的邻居节点中，选择一个邻居节点作为下一跳，同时修改并保存两节点之间的权重，权重修改方式如下：①若选择的邻居节点与上一节点相同，则以两个节点之间的权重乘以1/p的概率修改两节点之间的权重；②若选择的邻居节点与上一节点互为邻居节点，则两节点之间的权重不变；③若选择的邻居节点并...

【专利技术属性】
技术研发人员：罗绪成，谢敏锐，解书颖，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人