【技术实现步骤摘要】
【国外来华专利技术】具有职业和非职业内容的用户馈送
本文中公开的主题一般涉及用于对社交网络中的内容进行排名的方法、系统和程序,并且更特别地涉及用于选择用于在社交网络的用户馈送上发布的内容的方法、系统和计算机程序。
技术介绍
社交网络经常在通常被称为用户馈送的内容中提供大量的内容用于呈现给用户。用户对用户馈送的兴趣主要取决于内容的质量:如果内容是无趣的,则用户将放弃社交网络,但是如果内容是有趣的,则用户将继续访问用户馈送。发现用户感兴趣的内容是具有挑战性的命题,因为社交网络必须理解用户馈送中的帖子的内容,以便向用户赋予期望的兴趣水平。当用户馈送包括职业内容(例如,与用户的职业相关的内容)和非职业内容(例如,与社交网络中的用户的朋友相关的内容)时,问题被进一步复杂化。附图说明附图中的各种附图仅图示出本公开内容的示例实施例并且不能被认为是限制其范围。图1是图示出根据一些示例实施例的包括社交联网服务器的联网系统的框图。图2A和2B是根据一些示例实施例的在社交网站上包括用户馈送的用户界面的截屏。图3是根据一些示例实施例的用于为用户馈送选择内容的方法的流程图。图4是图示出根据一些示例实施例的用于训练分类器的方法的图。图5是图示出根据一个示例实施例的将帖子分配给集群的图。图6是图示出根据一些示例实施例的用于对非职业内容进行排名的方法的图。图7是图示出根据一些示例实施例的用于创建用户馈送的方法的图。图8图示出根据一个示例实施例的提供对用户馈送的访问的社交联网服务器。图9是根据一些示例实施例的用于对包括职业和非职业帖子的用户馈送的内容进行优化的方法的流程图。图10是图示出根据一些示例实施例的可 ...
【技术保护点】
1.一种方法,包括:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群;识别用于放置在社交网站的用户馈送中的多个帖子,每个帖子与得分相关联;基于所述帖子中的单词的语义含义,将来自所述多个帖子的每个帖子分配给所述多个集群中的一个;调用所述机器学习分类器以将每个帖子分类为职业帖子或非职业帖子;增加被分类为职业帖子的所述帖子的得分;以及基于每个帖子的得分对所述多个帖子进行排名以用于呈现在所述用户馈送中,其中所述方法的操作由处理器来执行。
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群;识别用于放置在社交网站的用户馈送中的多个帖子,每个帖子与得分相关联;基于所述帖子中的单词的语义含义,将来自所述多个帖子的每个帖子分配给所述多个集群中的一个;调用所述机器学习分类器以将每个帖子分类为职业帖子或非职业帖子;增加被分类为职业帖子的所述帖子的得分;以及基于每个帖子的得分对所述多个帖子进行排名以用于呈现在所述用户馈送中,其中所述方法的操作由处理器来执行。2.如权利要求1所述的方法,其中每个帖子的分配进一步包括:为所述帖子中的每个单词计算语义向量;基于针对所述帖子中的单词的语义向量来计算针对所述帖子的语义向量;以及对所述帖子的语义向量进行k均值聚类以获得识别被分配给所述帖子的集群的帖子集群标识符。3.如权利要求2所述的方法,其中所述语义向量是在多维空间中,其中将每个语义向量定位在所述多维空间中,使得共享语义含义的单词接近地位于所述多维空间中。4.如权利要求1所述的方法,其中针对每个帖子的得分是基于针对所述帖子的呈现的点进率。5.如权利要求1所述的方法,其中所述职业帖子与所述帖子的发帖者的职业活动相关联,其中所述非职业帖子不与所述帖子的发帖者的职业活动相关联。6.如权利要求1所述的方法,其中所述机器学习分类器的训练进一步包括:获得由一个或多个人针对多个训练帖子输入的鉴定;向分类器训练程序输入所述多个训练帖子、针对所述多个训练帖子的所述鉴定以及所述多个特征;以及执行所述分类器训练程序以训练所述机器学习分类器。7.如权利要求1所述的方法,其中所述多个特征进一步包括以下中的一个或多个:所述帖子的长度;所述帖子是否包括图片;选自评论、共享或原始帖子中的所述帖子的类型;所述帖子的发帖者的声誉以及发帖时间。8.如权利要求1所述的方法,其中增加被分类为职业帖子的帖子的得分包括将被分类为职业帖子的帖子的得分乘以大于1的常数。9.如权利要求1所述的方法,其中对所述多个职业帖子进行排名进一步包括:按照所述帖子的得分的降序对所述帖子进行整理,其中将具有较高得分的帖子在所述用户馈送中呈现在具有较低得分的帖子前面。10.如权利要求1所述的方法,其中针对所述非职业帖子的得分由机器学习算法基于选自包括以下的群组的至少一个或多个特征来确定:查看者与发帖者之间的历史关系、所述查看者与所述发帖者之间的连接强度、所述帖子的类型、所述帖子中的文本、所述帖子的长度、所述发帖者的简档以及所述查看者的简档。11.一种系统,包括:包括指令的存储器;以及一个或多个计算机处理器,其中所述指令在由所述一个或多个计算机处理器执行时引起所述一个或多个计算机处理器实行包括以下的操作:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群;识别用于放置在社交网站的用户馈送中的多个帖子,每个帖子与得分相关联;基...
【专利技术属性】
技术研发人员:张梁,L·朱,D·王,S·赵,Y·刘,S·陈,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。