基于主题模型的家庭成员属性预测方法、装置及智能终端制造方法及图纸

技术编号：20485053 阅读：20 留言：0更新日期：2019-03-02 19:02

本发明专利技术提供了一种基于主题模型的家庭成员属性预测方法、装置及智能终端，方法包括：获取媒资库中各视频在各个主题上的概率分布；根据用户对各视频的偏好权重以及各视频在各个主题上的概率分布，生成用户的主题偏好概率分布；利用用户的主题偏好概率分布作为逻辑回归模型的输入特征，得到逻辑回归模型输出的多种用户属性的概率分布；根据多种用户属性的概率分布统计出符合显著属性特性的属性数量，将所述符合显著属性特性的属性数量确认为家庭成员的数量，并记录各个家庭成员对应的用户属性。本申请提供的家庭成员属性预测方法能够极大地提升家庭成员属性特征覆盖度，有效地丰富了大屏用户画像人群基本属性维度。

全部详细技术资料下载

【技术实现步骤摘要】
基于主题模型的家庭成员属性预测方法、装置及智能终端
本公开涉及计算机数据挖掘
，尤其涉及一种基于主题模型的家庭成员属性预测方法、装置及智能终端。
技术介绍
目前，各大视频网站为了提升产品服务和提高企业利润，在产品与用户交互的各个业务领域实施了越来越多的以用户画像(即通过对人群基本属性、行为习惯、商业价值等多种维度信息数据的综合分析结果)为基础的大数据优化策略。例如，为了提升用户体验，增加用户粘性，将视频个性化地组织推荐给用户，或者为提升广告投放精准度，提高投入产出比，进行广告个性化投放等。区别于移动设备，大屏设备为家庭共用设备，对于大部分设备而言，其用户角色超过一种，不同性别、年龄段的用户角色的行为模式及偏好可能存在较大差异，因此，用户画像人群基本属性中家庭成员属性的扩充对完备用户画像维度，以及对推荐系统、广告系统、搜索引擎的优化等方面至关重要。
技术实现思路
本专利技术实施例中提供了一种基于主题模型的家庭成员属性预测方法、装置及智能终端，以解决现有技术中针对大屏设备的用户画像中缺少家庭成员属性分析的问题。第一方面，本专利技术提供了一种基于主题模型的家庭成员属性预测方法，包括：获取媒资库中各视频在各个主题上的概率分布；根据用户对各视频的偏好权重以及各视频在各个主题上的概率分布，生成用户的主题偏好概率分布；利用所述用户的主题偏好概率分布作为逻辑回归模型的输入特征，得到逻辑回归模型输出的多种用户属性的概率分布，所述逻辑回归模型的训练样本为利用外部数据资源获取的用户属性的标准样本；根据所述多种用户属性的概率分布统计出符合显著属性特性的属性数量，将所述符合显著属...

【技术保护点】
1.一种基于主题模型的家庭成员属性预测方法，其特征在于，包括：获取媒资库中各视频在各个主题上的概率分布；根据用户对各视频的偏好权重以及各视频在各个主题上的概率分布，生成用户的主题偏好概率分布；利用所述用户的主题偏好概率分布作为逻辑回归模型的输入特征，得到逻辑回归模型输出的多种用户属性的概率分布，所述逻辑回归模型的训练样本为利用外部数据资源获取的用户属性的标准样本；根据所述多种用户属性的概率分布统计出符合显著属性特性的属性数量，将所述符合显著属性特性的属性数量确认为家庭成员的数量，并记录各个家庭成员对应的用户属性。

【技术特征摘要】
1.一种基于主题模型的家庭成员属性预测方法，其特征在于，包括：获取媒资库中各视频在各个主题上的概率分布；根据用户对各视频的偏好权重以及各视频在各个主题上的概率分布，生成用户的主题偏好概率分布；利用所述用户的主题偏好概率分布作为逻辑回归模型的输入特征，得到逻辑回归模型输出的多种用户属性的概率分布，所述逻辑回归模型的训练样本为利用外部数据资源获取的用户属性的标准样本；根据所述多种用户属性的概率分布统计出符合显著属性特性的属性数量，将所述符合显著属性特性的属性数量确认为家庭成员的数量，并记录各个家庭成员对应的用户属性。2.根据权利要求1所述的方法，其特征在于，根据所述多种用户属性的概率分布统计出符合显著属性特性的属性数量包括：获取用户在多种属性条件下的综合概率分布；获取整个用户群体在所述多种属性下的群体概率分布；统计出所述综合概率高于所述群体概率分布的预设点位的属性数量。3.根据权利要求1所述的方法，其特征在于，利用外部数据资源获取用户属性的标准样本包括：利用内部数据资源获取多个视频观看时间，并利用外部数据资源获取各个视频的观看用户群属性特征概率分布Pi；利用(观看时间i*Pi)计算出用户的属性概率，其中，n为多个视频的数量，1≤i≤n；将所述用户的属性概率做归一化处理，得到用户属性的归一化概率；选取所述归一化概率大于预设阈值的用户作为用户属性的标准样本。4.根据权利要求1所述的方法，其特征在于，所述根据用户对各视频的偏好权重以及各视频在各个主题上的概率分布，生成用户的主题偏好概率分布包括：获取用户观看视频的总时长；根据用户对各视频的观看时长与所述总时长的比例计算得出用户对各视频的偏好权重矩阵；将所述偏好权重矩阵与各视频在各个主题上的概率分布矩阵相乘，得到用户的主题偏好概率分布。5.一种基于主题模型的家庭成员属性预测装置，其特征在于，包括：获取模块，用于获取媒资库中各视频在各个主题上的概率分布；生成模块，用于根据用户对各视频的偏好权重...

【专利技术属性】
技术研发人员：王新杰，王洁，徐钊，
申请(专利权)人：聚好看科技股份有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人