一种基于工作文档预判用户职业的方法和装置制造方法及图纸

技术编号：17704932 阅读：24 留言：0更新日期：2018-04-14 17:54

本发明专利技术提出一种基于工作文档预判用户职业的方法，包括以下步骤：获取用户对工作文档的使用信息，其中使用信息至少包括的文档标题和文档类型；根据用户对工作文档的使用信息以及记录已标注用户职业的标注库，构建训练样本；基于训练样本，建立并训练多层感知分类器；以及利用已训练的多层感知分类器预测用户职业。本发明专利技术的有益效果是：通过分析不同职业用户在使用工作文档的类型上的显著差异，训练职业的判定模型，利用待判定用户的使用信息反推用户的职业，提高了用户职业的判断准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于工作文档预判用户职业的方法和装置
本专利技术涉及信息分析领域，尤其涉及一种基于工作文档预判用户职业的方法和装置。
技术介绍
随着移动互联网和移动互联网的普及和发展，应用软件的开发商及运营商越来越关心其产品的主要使用群体的信息，例如群体的职业、年龄、性别以及使用习惯等等。基于信息分析产品的当前客户群体分布，可以在后继阶段更有针对性地开展商业推销活动或者应用软件本身的功能开发，从而为客户提供更准确的服务或商品。以手机游戏为例，用户的职业不同，对具体的游戏需求也不相同。譬如，大学生刺激、快节奏和对抗性的社交类游戏。家庭主妇则更喜欢玩休闲类的游戏。公务员或事业单位人员则喜欢益智类游戏等等。为了提高手机游戏推荐的效果，可以根据用户的具体职业定向推荐适合游戏类型，以优化用户体验，并提高推送的点击率。但是，一方面为了提高注册的时间效率，应用软件一般不要求用户在在注册时必须填报职业；另一方面，即使部分用户填写了这方面信息，也不能保证其填写正确。这造成相关信息在数据库中缺失。目前业界对用户职业预测的研究较少，业务较少对这个难题进行研究。现有方法是根据用户所使用设备所上报的定位信息(例如手机的LBS位置定位)，推测用户所处的建筑物，从而间接推定用户的职业。例如，授权公告号为CN102075850B的专利技术专利提出了如下一种技术方案：采集规定时段内移动用户的信令位置变化信息；利用采集到的信令位置变化信息构成移动用户的信令位置轨迹；以及根据设定的信令位置轨迹和职业信息的对应关系，以及构成的信令位置轨迹确定移动用户的职业信息。上述方法依赖于用户的信令位置变化信息。然而，信...
一种基于工作文档预判用户职业的方法和装置

【技术保护点】
一种基于工作文档预判用户职业的方法，其特征在于，包括以下步骤：获取用户对工作文档的使用信息，其中使用信息至少包括的文档标题和文档类型；根据用户对工作文档的使用信息以及记录已标注用户职业的标注库，构建训练样本；基于训练样本，建立并训练多层感知分类器；以及利用已训练的多层感知分类器预测用户职业。

【技术特征摘要】
1.一种基于工作文档预判用户职业的方法，其特征在于，包括以下步骤：获取用户对工作文档的使用信息，其中使用信息至少包括的文档标题和文档类型；根据用户对工作文档的使用信息以及记录已标注用户职业的标注库，构建训练样本；基于训练样本，建立并训练多层感知分类器；以及利用已训练的多层感知分类器预测用户职业。2.根据权利要求1所述方法，其特征在于，标注库至少包括用户的特征向量和标注职业。3.根据权利要求2所述方法，其特征在于，根据用户对工作文档的使用信息以及记录已标注用户职业的标注库，构建训练样本进一步包括以下子步骤：根据使用信息，对文档标题作中文分词；对已经分词的文档标题和文档类型，分别按照主题形成主题分布向量，以及按照文档类型形成文档类型向量；拼接主题分布向量和文档类型向量，形成用户特征向量作为训练样本的部分。4.根据权利要求3所述方法，其特征在于，主题分布向量是基于LDA主题模型迭代生成的。5.根据权利要求3所述方法，其特征在于，训练样...

【专利技术属性】
技术研发人员：余建兴，
申请(专利权)人：珠海金山网络游戏科技有限公司，广州西山居世游网络科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人