用于对社交媒体的用户分类的方法、计算机程序和计算机技术

技术编号：12953792 阅读：97 留言：0更新日期：2016-03-02 13:17

为了无需获取所有用户的内容就能根据内容相似性分类，提供一种用于聚类社交媒体中的多个用户的方法，其中将各个用户与一文本简档和文本内容相关联，该方法包含以下步骤：根据与一部分用户相关联的内容，为该部分用户的各个用户生成一个内容特征向量；根据内容特征向量，生成多个群集并且映射该多个群集与该部分用户；根据与映射到每个群集的该部分用户相关联的简档为该多个群集的各个群集生成第一简档特征向量；和根据与除该部分用户以外的其他用户相关联的简档和第一简档特征向量，把其他用户的各个用户划归入多个群集。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及信息处理技术，更具体来说，涉及更有效地识别社交媒体中的用户集合的技术。
技术介绍
随着社交媒体的广泛使用，按"偏好和兴趣"为社交媒体用户分类，用于市场营销，越来越广为人知。例如，这些分类被用来识别用户有可能购买的产品和服务，以及分割大型用户集合（按照相似兴趣的分类）。已经有人尝试根据年龄和政治倾向相似的用户在社交媒体上发布相似内容的假设来识别用户集合。例如，有人已经努力过用内容相似性来估计用户的年龄和政治倾向（非专利文献1和非专利文献2)，这些努力已经取得了一定的成功。用类似的技术来估计具有共同偏好和兴趣的用户集合被认为在理论上是可能的。现有技术文献专利文献专利文献1 :特许4, 898, 938号公报专利文献2 :特开2000-148864号公报非专利文献非专利文献l:Pennacchiotti，M.、Popescu，A._M.，2011 年， ^Democrats,RepublicansandStarbucksAfficionados:UserClassificationin Twitter,'，Proceedingsofthe17thACMSIGKDDInternationalConferenceon KnowledgeDiscoveryandDataMining(KDD2011)，pp. 430-438, 2011.("民主党人、共和党人和星巴克迷：推特中的用户分类"，第17届ACMSIGKDD知识发现和数据挖掘国际研讨会论文集，2011年，第430-438页）。非专利文献 2 :Rao,D....

【技术保护点】
一种用计算机把社交媒体中的多个用户划归入多个群集的方法，该多个用户中的各个用户与文本简档和文本内容相关联，该方法包含下述步骤：根据与一部分用户相关联的内容，为该部分用户的各个用户生成内容特征向量；根据所述内容特征向量，生成多个群集并且映射该多个群集与该部分用户；根据与映射到各个群集的该部分用户相关联的简档为该多个群集的各个群集生成第一简档特征向量；和根据与除该部分用户以外的其他用户相关联的简档和第一简档特征向量，把其他用户中的各个用户划归入多个群集。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：西山莉纱，吉田一星，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人