具有职业和非职业内容的用户馈送制造技术

技术编号:19075829 阅读:32 留言:0更新日期:2018-09-29 17:51
呈现了用于优化包括职业和非职业帖子的用户馈送的内容的方法、系统和计算机程序。一种方法包括用于训练机器学习分类器以基于包括分配给每个帖子的集群的多个特征将社交网站的帖子分类为职业或非职业帖子的操作。识别用于放置在社交网站的用户馈送中的帖子,每个帖子与得分相关联,并且基于所述帖子中的单词的语义含义将每个帖子分配给所述集群中的一个。该方法进一步包括用于调用机器学习分类器来将每个帖子分类为职业或非职业帖子的操作,以及用于增加被分类为职业帖子的帖子的得分的操作。基于每个帖子的得分对帖子进行排名以用于呈现在用户馈送中。

【技术实现步骤摘要】
【国外来华专利技术】具有职业和非职业内容的用户馈送
本文中公开的主题一般涉及用于对社交网络中的内容进行排名的方法、系统和程序,并且更特别地涉及用于选择用于在社交网络的用户馈送上发布的内容的方法、系统和计算机程序。
技术介绍
社交网络经常在通常被称为用户馈送的内容中提供大量的内容用于呈现给用户。用户对用户馈送的兴趣主要取决于内容的质量:如果内容是无趣的,则用户将放弃社交网络,但是如果内容是有趣的,则用户将继续访问用户馈送。发现用户感兴趣的内容是具有挑战性的命题,因为社交网络必须理解用户馈送中的帖子的内容,以便向用户赋予期望的兴趣水平。当用户馈送包括职业内容(例如,与用户的职业相关的内容)和非职业内容(例如,与社交网络中的用户的朋友相关的内容)时,问题被进一步复杂化。附图说明附图中的各种附图仅图示出本公开内容的示例实施例并且不能被认为是限制其范围。图1是图示出根据一些示例实施例的包括社交联网服务器的联网系统的框图。图2A和2B是根据一些示例实施例的在社交网站上包括用户馈送的用户界面的截屏。图3是根据一些示例实施例的用于为用户馈送选择内容的方法的流程图。图4是图示出根据一些示例实施例的用于训练分类器的方法的图。图5是图示出根据一个示例实施例的将帖子分配给集群的图。图6是图示出根据一些示例实施例的用于对非职业内容进行排名的方法的图。图7是图示出根据一些示例实施例的用于创建用户馈送的方法的图。图8图示出根据一个示例实施例的提供对用户馈送的访问的社交联网服务器。图9是根据一些示例实施例的用于对包括职业和非职业帖子的用户馈送的内容进行优化的方法的流程图。图10是图示出根据一些示例实施例的可以被安装在机器上的软件架构的示例的框图。图11图示出根据示例实施例的形式为计算机系统的机器的图解表示,在该机器内可以执行一组指令用以引起该机器实行本文中讨论的方法论中的任何一个或多个。具体实施方式呈现了用于优化包括职业和非职业帖子的用户馈送的内容的示例方法、系统和计算机程序。示例仅代表可能的变化。除非另有明确陈述,否则组件和功能是可选的并且可以被组合或被细分,并且操作可以在顺序方面进行变化或者可以被组合或细分。在以下描述中,为了解释的目的,阐述了众多具体的细节以提供对示例实施例的透彻理解。然而,对本领域技术人员将显而易见的是,可以在没有这些具体细节的情况下实践本主题。在一些示例实施例中,社交网站中的用户馈送包括与和用户的社交活动相关的非职业内容混合的、与用户的职业活动相关的职业内容。内容由社交网络的其它用户来提供,并且系统通过利用机器学习技术训练分类器自动确定帖子类型来确定每个帖子是否被认为是职业或非职业内容。机器学习分类器利用一个或多个特征来进行关于帖子是否被认为是职业或非职业的确定。特征是可以包括有用于确定帖子是否被认为是职业或非职业的信息的发帖成员或帖子的各方面。机器学习分类器所考虑的特征中的一个是帖子的文本。对文本进行分析并且基于每个单词的语义含义将帖子中的单词分配给多个集群中的一个。此外,基于单词的集群化将帖子分配给集群中的一个。然后将单词和帖子的集群用作用于机器学习分类器(也被称为机器学习工具或P/NP工具)的特征。在机器学习分类器确定帖子的类型之后,基于分配给每个帖子的得分将职业和非职业帖子混合到用户馈送中。在一个示例实施例中,提高(例如,增加)职业帖子的得分以相对于非职业帖子有利于职业帖子。在一个一般方面中,一种方法包括用于训练机器学习分类器以基于包括分配给每个帖子的集群的多个特征将社交网站的帖子分类为职业或非职业帖子的操作。识别用于放置在社交网站的用户馈送中的帖子,每个帖子与得分相关联,并且基于所述帖子中的单词的语义含义将每个帖子分配给所述集群中的一个。所述方法进一步包括用于调用机器学习分类器来将每个帖子分类为职业或非职业帖子的操作,以及用于增加被分类为职业帖子的帖子的得分的操作。基于每个帖子的得分对帖子进行排名以用于呈现在用户馈送中。这增加了职业帖子相对于非职业帖子的定位。一个一般方面包括一种系统,其包括包含指令的存储器和一个或多个计算机处理器。所述指令在由所述一个或多个计算机处理器执行时引起所述一个或多个计算机处理器实行包括以下的操作:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群。识别用于放置在社交网站的用户馈送中的帖子,每个帖子与得分相关联,并且基于所述帖子中的单词的语义含义将每个帖子分配给所述集群中的一个。所述操作进一步包括调用机器学习分类器来将每个帖子分类为职业帖子或非职业帖子,以及用于增加被分类为职业帖子的帖子的得分的操作。基于每个帖子的得分对帖子进行排名以用于呈现在用户馈送中。一个一般方面包括包含指令的非暂时性机器可读存储介质,所述指令在由机器执行时引起所述机器实行包括以下的操作:训练机器学习分类器来基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群。识别用于放置在社交网站的用户馈送中的帖子,每个帖子与得分相关联,并且基于所述帖子中的单词的语义含义将每个帖子分配给所述集群中的一个。所述操作进一步包括调用机器学习分类器来将每个帖子分类为职业帖子或非职业帖子,以及用于增加被分类为职业帖子的帖子的得分的操作。基于每个帖子的得分对帖子进行排名以用于呈现在用户馈送中。图1是图示出根据一些示例实施例的包括社交联网服务器112的联网系统的框图,其图示出高层级的基于客户端-服务器的网络架构102的示例实施例。社交联网服务器112经由网络114(例如,互联网或广域网(WAN))向一个或多个客户端设备104提供服务器侧功能性。图1图示出在客户端设备104上执行的例如web浏览器106(例如,由微软公司(Corporation)开发的Internet浏览器)、(一个或多个)客户端应用程序108以及社交联网客户端110。社交联网服务器112进一步与提供对一个或多个数据库116-124的访问的一个或多个数据库服务器126通信地耦合。客户端设备104可以包括但不限于,移动电话、台式计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板、超级本、上网本、多处理器系统、基于微处理器的或可编程的消费者电子系统或用户128可用来访问社交联网服务器112的任何其它通信设备。在一些实施例中,客户端设备104可以包括用以显示信息(例如,以用户界面的形式)的显示模块(未示出)。在另外的实施例中,客户端设备104可以包括触摸屏、加速度计、陀螺仪、相机、麦克风、全球定位系统(GPS)设备等中的一个或多个。在一个实施例中,社交联网服务器112是对来自客户端设备104的搜索查询或初始化请求进行响应的基于网络的装置。一个或多个用户128可以是人、机器或与客户端设备104交互的其它部件。在各种实施例中,用户128不是网络架构102的一部分,但是可以经由客户端设备104或另一部件与网络架构102进行交互。例如,网络114的一个或多个部分可以是自组网、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、WAN、无线WAN(WWAN)、城域网(MAN)、互联网的一部分、公共交换电话网络(本文档来自技高网...

【技术保护点】
1.一种方法,包括:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群;识别用于放置在社交网站的用户馈送中的多个帖子,每个帖子与得分相关联;基于所述帖子中的单词的语义含义,将来自所述多个帖子的每个帖子分配给所述多个集群中的一个;调用所述机器学习分类器以将每个帖子分类为职业帖子或非职业帖子;增加被分类为职业帖子的所述帖子的得分;以及基于每个帖子的得分对所述多个帖子进行排名以用于呈现在所述用户馈送中,其中所述方法的操作由处理器来执行。

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群;识别用于放置在社交网站的用户馈送中的多个帖子,每个帖子与得分相关联;基于所述帖子中的单词的语义含义,将来自所述多个帖子的每个帖子分配给所述多个集群中的一个;调用所述机器学习分类器以将每个帖子分类为职业帖子或非职业帖子;增加被分类为职业帖子的所述帖子的得分;以及基于每个帖子的得分对所述多个帖子进行排名以用于呈现在所述用户馈送中,其中所述方法的操作由处理器来执行。2.如权利要求1所述的方法,其中每个帖子的分配进一步包括:为所述帖子中的每个单词计算语义向量;基于针对所述帖子中的单词的语义向量来计算针对所述帖子的语义向量;以及对所述帖子的语义向量进行k均值聚类以获得识别被分配给所述帖子的集群的帖子集群标识符。3.如权利要求2所述的方法,其中所述语义向量是在多维空间中,其中将每个语义向量定位在所述多维空间中,使得共享语义含义的单词接近地位于所述多维空间中。4.如权利要求1所述的方法,其中针对每个帖子的得分是基于针对所述帖子的呈现的点进率。5.如权利要求1所述的方法,其中所述职业帖子与所述帖子的发帖者的职业活动相关联,其中所述非职业帖子不与所述帖子的发帖者的职业活动相关联。6.如权利要求1所述的方法,其中所述机器学习分类器的训练进一步包括:获得由一个或多个人针对多个训练帖子输入的鉴定;向分类器训练程序输入所述多个训练帖子、针对所述多个训练帖子的所述鉴定以及所述多个特征;以及执行所述分类器训练程序以训练所述机器学习分类器。7.如权利要求1所述的方法,其中所述多个特征进一步包括以下中的一个或多个:所述帖子的长度;所述帖子是否包括图片;选自评论、共享或原始帖子中的所述帖子的类型;所述帖子的发帖者的声誉以及发帖时间。8.如权利要求1所述的方法,其中增加被分类为职业帖子的帖子的得分包括将被分类为职业帖子的帖子的得分乘以大于1的常数。9.如权利要求1所述的方法,其中对所述多个职业帖子进行排名进一步包括:按照所述帖子的得分的降序对所述帖子进行整理,其中将具有较高得分的帖子在所述用户馈送中呈现在具有较低得分的帖子前面。10.如权利要求1所述的方法,其中针对所述非职业帖子的得分由机器学习算法基于选自包括以下的群组的至少一个或多个特征来确定:查看者与发帖者之间的历史关系、所述查看者与所述发帖者之间的连接强度、所述帖子的类型、所述帖子中的文本、所述帖子的长度、所述发帖者的简档以及所述查看者的简档。11.一种系统,包括:包括指令的存储器;以及一个或多个计算机处理器,其中所述指令在由所述一个或多个计算机处理器执行时引起所述一个或多个计算机处理器实行包括以下的操作:训练机器学习分类器以基于多个特征将社交网站的帖子分类为职业帖子或非职业帖子,所述多个特征包括来自分配给每个帖子的多个集群中的集群;识别用于放置在社交网站的用户馈送中的多个帖子,每个帖子与得分相关联;基...

【专利技术属性】
技术研发人员:张梁L·朱D·王S·赵Y·刘S·陈
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1