【技术实现步骤摘要】
本专利技术涉及计算机领域,尤其涉及一种用于确定用户的家庭属性信息的技术。
技术介绍
随着家庭互联网技术的蓬勃发展,越来越多的业务以家庭为单位进行开展,所以识别出哪些用户来自同一家庭,对于解决家庭互联网精细数据化运营至关重要。现有技术中,对于用户家庭识别方法主要通过电话座机与手机号的通信数据关系进行推断,这种方法存在着几个缺陷,例如,基于小样本数据建模容易过拟合,数据采集成本越来越高,无法把用户通信设备进行统一识别,不便于采用互联网行为特征进行扩展,家庭用户的覆盖率和识别率不高等。随着家庭互联网技术的发展,上述问题会越来越突出。
技术实现思路
本申请的目的是提供一种用于确定用户的家庭属性信息的方法与设备,以解决用户与对应网络设备所在的家庭是否具有家庭关联关系的问题。根据本申请的一个方面,提供了一种用于确定用户的家庭属性信息的方法,其中,该方法包括:获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息;通过对所述样本数据进行机器学习确定对应的关联决策模型信息;将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备对应的家庭的家庭关联信息。根据本申请的另一方面,还提供了一种用于确定用户的家庭属性信息的设备,其中,该设备包括:样本获取装置,用于获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息;模型确定装置,用于通过对所述样本数据进行机器学习确定对应的关联决策模型信息;模型应用装置,用于将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备对应的家庭的家庭关联信息。 ...
【技术保护点】
一种用于确定用户的家庭属性信息的方法,其中,该方法包括:获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息;通过对所述样本数据进行机器学习确定对应的关联决策模型信息;将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备对应的家庭的家庭关联信息。
【技术特征摘要】
1.一种用于确定用户的家庭属性信息的方法,其中,该方法包括:获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息;通过对所述样本数据进行机器学习确定对应的关联决策模型信息;将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备对应的家庭的家庭关联信息。2.根据权利要求1所述的方法,其中,所述将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备对应的家庭的家庭关联信息包括:将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备的设备关联信息;当所述设备关联信息超过预定的关联阈值信息,确定所述用户与所述网络设备对应的家庭的家庭关联信息为关联。3.根据权利要求1或2所述的方法,其中,该方法还包括:当两个用户与同一网络设备对应的家庭的家庭关联信息均为关联时,确定所述两个用户属于同一家庭。4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括:根据目标家庭对应的目标网络设备确定所述目标家庭所包括的多个目标用户,其中,所述目标用户与所述目标网络设备对应的家庭的家庭关联信息为关联。5.根据权利要求4所述的方法,其中,该方法还包括:根据所述目标用户的用户画像信息确定所述目标家庭的家庭画像信息;根据所述家庭画像信息为所述目标家庭提供推荐信息。6.根据权利要求1至5中任一项所述的方法,其中,所述样本数据包括正样本数据,其中,所述正样本数据包括样本用户与样本网络设备相关联的关联信息;其中,所述获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息包括:根据多个用户使用不同网络设备的通信记录信息建立多个用户与通信设
\t备关联组;基于预定规则从所述多个用户与通信设备关联组中筛选确定同一个用户对应的优选网络设备,并作为相关联的样本用户与样本网络设备记入所述正样本数据。7.根据权利要求6所述的方法,其中,所述预定规则包括以下至少任一项:所述优选网络设备的设备位置信息与所述同一个用户的家庭位置信息间的距离信息小于或等于预定的关联距离阈值信息;所述同一个用户所使用的其他网络设备的设备位置信息与所述家庭位置信息间的距离信息等于或大于预定的无关距离阈值信息;所述优选网络设备的设备位置信息与所述同一个用户的家庭位置信息间的距离信息小于所述同一个用户所使用的其他网络设备的设备位置信息与所述家庭位置信息间的距离信息。8.根据权利要求6或7所述的方法,其中,所述样本数据还包括负样本数据,其中,所述负样本数据包括样本用户与样本网络设备无关联的关联信息;其中,所述获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息还包括:根据所述同一个用户与所使用的其他通信设备间的累计通信量信息优选所述同一个用户对应的无关网络设备,并作为无关联的样本用户与样本网络设备记入所述负样本数据。9.根据权利要求6至8中任一项所述的方法,其中,所述用户与通信设备关联组中通信设备的通信用户数小于或等于家庭用户数阈值。10.根据权利要求9所述的方法,其中,该方法还包括:根据所述用户与通信设备关联组中通信设备所在地域的家庭人口普查信息确定所述家庭用户数阈值。11.根据权利要求6至10中任一项所述的方法,其中,所述根据多个用户使用不同网络设备的通信记录信息建立多个用户与通信设备关联组包括:根据用户标识信息间的映射关系将同一个用户的不同用户标识信息所对
\t应的通信记录信息归并为同一个用户的通信记录信息;根据归并后的多个用户使用不同网络设备的通信记录信息建立多个用户与通信设备关联组。12.根据权利要求6至11中任一项所述的方法,其中,所述获取样本数据,其中,所述样本数据包括样本用户与样本网络设备的关联信息还包括:提取所述样本数据中的样本特征信息;其中,所述通过对所述样本数据进行机器学习确定对应的关联决策模型信息包括:通过对所述样本数据及其中的样本特征信息进行机器学习确定对应的关联决策模型信息。13.根据权利要求12所述的方法,其中,所述将用户关于网络设备的使用记录信息应用于所述关联决策模型信息,以获得所述用户与所述网络设备对应的家庭的家庭关联信息包括:根据所述样本特征信息从用户关于网络设备的使用记录信息中提取预测特征信息;将所述预测特征...
【专利技术属性】
技术研发人员:吴保华,付登坡,甘云锋,黄耐寒,吕秀泉,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。