【技术实现步骤摘要】
一种基于假设检验确定标签质量的方法和装置
[0001]本申请涉及数据能力
,尤其涉及一种基于假设检验确定标签质量的方法和装置。
技术介绍
[0002]在大数据时代,企业的决策不再局限于传统的经营方式,特别在用户方面,通过标签化的方式可以让企业实现更加精细化的用户运营。标签的构建一般通过用户属性、行为进行,比如通过用户的购买行为数据,判断用户的性别,给用户打上性别标签,判断的依据一般是通过设定某一类规则,当用户的行为符合对应的判别规则时,此类用户便被打上相应标签,标签体系构建完毕后,企业便可依据相应的标签做精细化运营决策。
[0003]然而依赖于标签的精细化运营决策,也就依赖于标签构造的质量,若标签构造的质量较低,自然对业务的支撑力度和效果也会大大降低,特别的随着业务的发展、用户群体的变化,最初搭建的标签体系也许已经无法保障运营的效果。
[0004]当前企业在构造标签体系时,一般通过运营团队的专家经验结合客户的需求,来进行标签体系和生成规则的制定,后续标签体系的优化也依靠专家团队来决定。然而依赖专家团队的 ...
【技术保护点】
【技术特征摘要】
1.一种基于假设检验确定标签质量的方法,其特征在于,所述方法包括:根据用户行为信息和用户个人信息确定初始标签数据,其中,所述用户行为信息是通过用户日志确定的,所述用户个人信息是通过用户所在工作群组确定的;按照预设推理方案对所述初始标签数据的推理分析,得到样本标签数据;通过所述样本标签数据,按照假设检验的方式确定标签体系数据指标是否满足质量要求。2.根据权利要求1所述的方法,其特征在于,按照预设推理方案对所述初始标签数据的推理分析,得到样本标签数据包括:根据初始标签数据的组合,得到组合标签数据;根据所述初始标签数据的特征和所述组合标签数据的特征的推理,得到特征标签数据;将所述初始标签数据、组合标签数据和所述特征标签数据,作为样本标签数据。3.根据权利要求1所述的方法,其特征在于,通过所述样本标签数据,按照假设检验的方式确定标签体系数据指标是否满足质量要求包括:确定原假设和备择假设,其中,所述原假设用于指示当前标签体系数据指标满足质量要求,所述备择假设用于指示当前标签体系数据指标偏离质量要求;通过样本标签数据,采用双侧检测的方式将计算得到的统计量值与预设阈值做比较;根据比较结果,通过接受或者拒绝原假设的方式,确定标签体系数据指标是否满足质量要求。4.根据权利要求3所述的方法,其特征在于,样本标签数据包括样本标签量和样本标准差,所述通过样本标签数据,采用双侧检测的方式将计算得到的统计量值与预设阈值做比较包括:在所述样本标签量超过样本量阈值的情况下,根据所述样本标签数据计算得到z统计量;根据预设的标准正态分布表和所述样本标准差确定双侧的临界值;将所述z统计量的绝对值和所述临界值的绝对值进行比较。5.根据权利要求4所述的方法,其特征在于,根据比较结果,通过接受或者拒绝原假设的方式,确定标签体系数据指标是否满足质量要求包括:在所述z统计量的绝对值大于所述临界值的绝对值的情况下,拒绝原假设并接受备择假设,确定标签体系数据...
【专利技术属性】
技术研发人员:史佳艳,孟旭旭,
申请(专利权)人:北京明略昭辉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。