社交平台用户的现实关系匹配方法、装置及可读存储介质制造方法及图纸

技术编号:17363676 阅读:50 留言:0更新日期:2018-02-28 13:45
本发明专利技术公开了一种社交平台用户的现实关系匹配方法,包括步骤:获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型;获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型;将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。本发明专利技术结合用户的账号信息和用户之间的交互文本信息分析的方式,可以从社交平台里上亿的海量用户中准确的挖掘出在线用户的现实关系。本发明专利技术还提供一种数据处理装置及计算机可读存储介质。

Social platform users' real relationship matching methods, devices and readable storage media

The invention discloses a real social platform user matching method comprises the following steps: obtaining a social networking platform on the user's account information, according to each of the user's account information and TransE model of user vector model; obtaining the social platform users between the interactive text information, interactive information according to the text and the convolutional neural network model between the user build text relationship prediction model; the user vector model output and the output results of the model text projecting into the same space of linear joint output, the prediction results to get the relationship between the social reality of the user on the platform. By combining user account information and user interaction text information analysis, the invention can accurately excavate the real user relationship of online users from hundreds of millions of users in social platforms. The invention also provides a data processing device and a computer readable storage medium.

【技术实现步骤摘要】
社交平台用户的现实关系匹配方法、装置及可读存储介质
本专利技术涉及计算机网络
,尤其涉及一种社交平台用户的现实关系匹配方法、数据处理装置及计算机可读存储介质。
技术介绍
随着互联网的发展,微博、朋友圈、脸书(Facebook)以及推特(Twitter)等各类社交平台的流行,如何从上亿的海量用户中准确的挖掘出在线用户的现实关系,例如朋友、熟人和家人等亲密关系成为了一个重要的课题。传统的社交网络分析中,通常做法是根据网络结构进行节点间距离的衡量,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系。但是,由于社交网络特性,不少节点间虽然距离近,但是他们可能只是线上好友,线下或真实生活中根本没有见过面。而在例如金融产品领域、公共安全监控领域等应用中,正确地计算和识别在线用户在现实生活中的亲密关系才是最迫切需要的。
技术实现思路
本专利技术的主要目的在于提供一种在线社交用户的现实关系匹配方法、数据处理装置及计算机可读存储介质,旨在解决如何准确地计算和识别在线用户在现实生活中的亲密关系的技术问题。为实现上述目的,本专利技术提供的一种社交平台用户的现实关系匹配方法,包括以下步骤:获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型;获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型;将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。进一步地,所述根据每一所述用户的账号信息和TransE模型建立用户向量模型的步骤包括:根据每一所述用户的账号信息建立一个三元组<h,r,t>,其中,h,t是用户的账号信息中的实体,r是连接所述实体h,t之间的关系;根据TransE模型把所述每一个三元组<h,r,t>中每个实体和实体之间的关系映射为包含每个实体和实体之间的关系的低维度向量。进一步地,所述用户向量模型的目标函数包括:其中,<h,r,t>∈R(k×1),k是向量维度,[*]+为取*的正数部分,γ是一个超参数,S是所有真三元组集合,S'是所有随机生成的假三元组集合S'={<h',r,t>|h'∈E∪<h,r,t'>|t'∈E。进一步地,所述用户向量模型的输出结果hp=tanh(W1v1+W2v2),其中,所述v1和v2为所述用户向量模型的两个用户的向量输入,所述hp为所述用户向量模型的两个用户的向量输入v1和v2的加权非线性转化输出经偏差修正的输出结果,所述W1为所述用户的向量输入v1的权重,所述W2为所述用户的向量输入v2的权重。进一步地,所述获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型的步骤包括:获取所述社交平台上的用户之间的文本交互信息m,其中,所述文本交互信息m包括多个词语{u1,u2,u3,...un},m∈M<h,t>;m代表包含实体h,t的文本交互信息,M代表包含实体h,t的文本交互信息的集合;根据卷积神经网络模型对所述每一个词语建立低维度向量,通过已训练好的Word2Vec算法对所述每一个词语建立的低维度向量进行训练,重复提取所述词语并计算隐含特征向量,获取每一维所述隐含特征向量的最大值,并将所述隐含特征向量的最大值进行分类。进一步地,所述文本关系预测模型的目标函数包括:其中,这里是预测分类标记,fm是真实分类标记。进一步地,所述文本关系预测模型的输出结果r=max{hi},其中,hi=tanh(W-1ui-1+W0ui+W1ui+1),所述u为所述用户之间的文本交互信息中的词语,所述W-1代表ui-1的权重,所述W0代表ui的权重,所述W1代表ui+1的权重。进一步地,所述将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测分类的步骤包括:根据预设的线性联合算法函数:将所述用户向量模型的输出结果hp以及所述文本关系预测模型的输出结果Υ投射到一预设空间,输出得到所述社交平台上的用户的现实关系预测分类;其中,所述为将所述用户向量模型的输出结果hp投射到所述预设空间的参数,所述为将所述文本关系预测模型的输出结果Υ投射到所述预设空间的参数。本专利技术还提供一种数据处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的社交平台用户的现实关系匹配方法的步骤。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的社交平台用户的现实关系匹配方法的步骤。在本专利技术中,通过根据社交平台上的用户的账号信息和TransE模型建立用户向量模型,预测两个用户实体之间的关系程度;然后通过社交平台上的用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型,得到所述社交平台上的用户之间的现实关系的预测分类;通过将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。采用结合用户的账号信息和用户之间的交互文本信息分析的方式,根据社交平台上人与人间的互动行为进行亲密关系预测;有效地解决了仅仅进行用户的个人信息分析,通常只能分析出线上好友的缺点;同时,解决了针对用户之间的交互文本信息分析无法精准的分析用户之间的现实关系,例如,排除了采用交互文本信息分析的时候,通常只要两个用户用亲密表达交流,两个用户之间就被确定为有亲密关系的缺点。附图说明图1为本专利技术第一实施方式中的社交平台用户的现实关系匹配方法的方法流程图;图2为图1中社交平台用户的现实关系匹配方法的步骤S10的子流程图;图3为图1中社交平台用户的现实关系匹配方法的步骤S20的子流程图;图4为本专利技术一实施方式中的数据处理装置的模块结构示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。请参照图1,图1为本专利技术第一实施方式中的社交平台用户的现实关系匹配方法100的方法流程图,其中,所述数据处理方法100包括如下步骤:步骤S10,获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型。其中,所述社交平台上的用户可以是同一个平台上的注册的用户,也可以是跨社交平台上的不同社交平台的用户。所述社交平台可以是,互联网中的各类社交软件或者社交网站等,在此不做具体限制。所述用户的账号信息包括但不限于是,用户的姓名、昵称、性别、年龄、爱好、工作经历、个性签名、标签、籍贯、常住地址、邮箱、电话、社交账号等。TransE模型是基于实体和关系的分布式向量表示,将每个三元组实例(head,relation,tail)中本文档来自技高网...
社交平台用户的现实关系匹配方法、装置及可读存储介质

【技术保护点】
一种社交平台用户的现实关系匹配方法,其特征在于,包括步骤:获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型;获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型;将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。

【技术特征摘要】
1.一种社交平台用户的现实关系匹配方法,其特征在于,包括步骤:获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型;获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型;将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。2.如权利要求1所述的社交平台用户的现实关系匹配方法,其特征在于,所述根据每一所述用户的账号信息和TransE模型建立用户向量模型的步骤包括:根据每一所述用户的账号信息建立一个三元组<h,r,t>,其中,h,t是用户的账号信息中的实体,r是连接所述实体h,t之间的关系;根据TransE模型把所述每一个三元组<h,r,t>中每个实体和实体之间的关系映射为包含每个实体和实体之间的关系的低维度向量。3.如权利要求2所述的社交平台用户的现实关系匹配方法,其特征在于,所述用户向量模型的目标函数包括:其中,<h,r,t>∈R(k×1),k是向量维度,[*]+为取*的正数部分,γ是一个超参数,S是所有真三元组集合,S'是所有随机生成的假三元组集合S'={<h',r,t>|h'∈E∪<h,r,t'>|t'∈E。4.如权利要求2所述的社交平台用户的现实关系匹配方法,其特征在于,所述用户向量模型的输出结果hp=tanh(W1v1+W2v2),其中,所述v1和v2为所述用户向量模型的两个用户的向量输入,所述hp为所述用户向量模型的两个用户的向量输入v1和v2的加权非线性转化输出经偏差修正的输出结果,所述W1为所述用户的向量输入v1的权重,所述W2为所述用户的向量输入v2的权重。5...

【专利技术属性】
技术研发人员:王健宗吴天博黄章成肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1