【技术实现步骤摘要】
一种基于工作文档预判用户职业的方法和装置
本专利技术涉及信息分析领域,尤其涉及一种基于工作文档预判用户职业的方法和装置。
技术介绍
随着移动互联网和移动互联网的普及和发展,应用软件的开发商及运营商越来越关心其产品的主要使用群体的信息,例如群体的职业、年龄、性别以及使用习惯等等。基于信息分析产品的当前客户群体分布,可以在后继阶段更有针对性地开展商业推销活动或者应用软件本身的功能开发,从而为客户提供更准确的服务或商品。以手机游戏为例,用户的职业不同,对具体的游戏需求也不相同。譬如,大学生刺激、快节奏和对抗性的社交类游戏。家庭主妇则更喜欢玩休闲类的游戏。公务员或事业单位人员则喜欢益智类游戏等等。为了提高手机游戏推荐的效果,可以根据用户的具体职业定向推荐适合游戏类型,以优化用户体验,并提高推送的点击率。但是,一方面为了提高注册的时间效率,应用软件一般不要求用户在在注册时必须填报职业;另一方面,即使部分用户填写了这方面信息,也不能保证其填写正确。这造成相关信息在数据库中缺失。目前业界对用户职业预测的研究较少,业务较少对这个难题进行研究。现有方法是根据用户所使用设备所上报的定 ...
【技术保护点】
一种基于工作文档预判用户职业的方法,其特征在于,包括以下步骤:获取用户对工作文档的使用信息,其中使用信息至少包括的文档标题和文档类型;根据用户对工作文档的使用信息以及记录已标注用户职业的标注库,构建训练样本;基于训练样本,建立并训练多层感知分类器;以及利用已训练的多层感知分类器预测用户职业。
【技术特征摘要】
1.一种基于工作文档预判用户职业的方法,其特征在于,包括以下步骤:获取用户对工作文档的使用信息,其中使用信息至少包括的文档标题和文档类型;根据用户对工作文档的使用信息以及记录已标注用户职业的标注库,构建训练样本;基于训练样本,建立并训练多层感知分类器;以及利用已训练的多层感知分类器预测用户职业。2.根据权利要求1所述方法,其特征在于,标注库至少包括用户的特征向量和标注职业。3.根据权利要求2所述方法,其特征在于,根据用户对工作文档的使用信息以及记录已标注用户职业的标注库,构建训练样本进一步包括以下子步骤:根据使用信息,对文档标题作中文分词;对已经分词的文档标题和文档类型,分别按照主题形成主题分布向量,以及按照文档类型形成文档类型向量;拼接主题分布向量和文档类型向量,形成用户特征向量作为训练样本的部分。4.根据权利要求3所述方法,其特征在于,主题分布向量是基于LDA主题模型迭代生成的。5.根据权利要求3所述方法,其特征在于,训练样...
【专利技术属性】
技术研发人员:余建兴,
申请(专利权)人:珠海金山网络游戏科技有限公司,广州西山居世游网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。