主体检测方法及装置制造方法及图纸

技术编号:15691609 阅读:90 留言:0更新日期:2017-06-24 04:57
本申请公开了一种主体检测方法及装置,所述方法包括:获取检测主体使用的目标介质;所述目标介质为目标主体使用过的介质;获取每一目标介质预先训练获得的介质分数;根据各个目标介质的介质分数,判断所述检测主体是否为目标主体;其中,所述每一目标介质的介质分数按照如下训练方式预先生成:获取携带标签的训练数据;所述标签用于标识使用目标介质的目标主体以及非目标主体;针对每一个目标介质,计算所述训练数据中使用所述目标介质的目标主体数以及非目标主体数;获取所述目标介质的介质类型;根据所述目标主体数、所述非目标主体数以及所述介质类型,计算获得所述目标介质的介质分数。本申请实施例提高了主体检测的准确性。

Method and device for detecting main body

The invention discloses a subject detection method and device, the method comprises: acquiring the target medium detection; the target medium is the subject used medium; access to every target medium pre training medium score; medium according to the score of each of the target medium, whether the subject is detected the main target; the medium fraction of each target medium according to the following training methods: obtaining pre generated training data carry labels; the labels used to identify the use of the target medium target subject and non subject; for each target medium, calculate the training data using the target medium target the main non target number and the number of main types; medium to obtain the target medium; according to the target number, the main body of non target number And the media type, calculates the dielectric fraction of the target medium obtained. The embodiment of the present invention improves the accuracy of the subject detection.

【技术实现步骤摘要】
主体检测方法及装置
本申请属于信息处理
,具体地说,涉及一种主体检测方法及装置。
技术介绍
主体是指自然人、自然人形成的群体或者自然人在网络中对应的一个帐号。在很多业务场景中,存在从一群主体中发现特殊主体的需求,也即,需要对主体进行检测,以检测出满足一定条件的目标主体。例如在一群用户中寻找哪些用户更有可能购买本公司生产的产品或服务。再比如,在数亿人中寻找有实施恐怖袭击风险的人;又如,从大量支付账号中寻找存在风险的支付账号等。对主体的检测是依据主体使用的介质进行的,主体使用的介质可以包括不同的介质类型,如主体的属性,也即年龄、职业、收入、所在地等,主体的行为如从搜索引擎跳转到商品页面的浏览行为、在非安全环境修改密码的行为等特征。现有技术中,对主体的检测,通常是判断主体是否使用了满足目标条件的介质,如果是,则可以确定主体为目标主体。但是,由于一个主体通常具有多个介质,且不同介质类型的介质对主体的影响也是不同的,因此现有技术中的主体检测并准确。
技术实现思路
有鉴于此,本申请所要解决的技术问题是提供了主体检测方法及装置,提高了主体检测的准确性。为了解决上述技术问题,本申请公开了一种主体检本文档来自技高网...
主体检测方法及装置

【技术保护点】
一种主体检测方法,其特征在于,包括:获取检测主体使用的目标介质;所述目标介质为目标主体使用过的介质;获取每一目标介质预先训练获得的介质分数;根据各个目标介质的介质分数,判断所述检测主体是否为目标主体;其中,所述每一目标介质的介质分数按照如下训练方式预先生成:获取携带标签的训练数据;所述标签用于标识使用目标介质的目标主体以及非目标主体;针对每一个目标介质,计算所述训练数据中使用所述目标介质的目标主体数以及非目标主体数;获取所述目标介质的介质类型;根据所述目标主体数、所述非目标主体数以及所述介质类型,计算获得所述目标介质的介质分数。

【技术特征摘要】
1.一种主体检测方法,其特征在于,包括:获取检测主体使用的目标介质;所述目标介质为目标主体使用过的介质;获取每一目标介质预先训练获得的介质分数;根据各个目标介质的介质分数,判断所述检测主体是否为目标主体;其中,所述每一目标介质的介质分数按照如下训练方式预先生成:获取携带标签的训练数据;所述标签用于标识使用目标介质的目标主体以及非目标主体;针对每一个目标介质,计算所述训练数据中使用所述目标介质的目标主体数以及非目标主体数;获取所述目标介质的介质类型;根据所述目标主体数、所述非目标主体数以及所述介质类型,计算获得所述目标介质的介质分数。2.根据权利要求1所述的方法,其特征在于,所述根据各个目标介质的介质分数,判断所述检测主体是否为目标主体包括:将各个目标介质的介质分数进行汇总,获得所述检测主体的主体分数;根据所述主体分数,判断所述检测主体是否为目标主体。3.根据权利要求1或2所述的方法,其特征在于,所述获取每一目标介质预先训练获得的介质分数包括:根据每一目标介质使用的子介质以及每一子介质使用的下一级子介质,建立介质层级树形结构;所述目标介质作为分支节点或者叶子节点;对于任一个分支节点,获取其子节点对应的介质分数,将各个子节点的介质分数汇总获得的分数作为所述分支节点的介质分数;对于任一个叶子节点,获取预先训练获得的介质分数,所述叶子节点的介质分数为将所述叶子节点的父节点作为目标主体,所述叶子节点作为所述目标主体使用过的目标介质,按照所述目标介质的介质分数的训练方式预先生成的。4.根据权利要求1或2所述的方法,其特征在于,所述目标介质的介质分数为使用所述目标介质的主体为非目标主体的概率;所述根据所述目标主体数、所述非目标主体数以及所述介质类型,计算获得所述目标介质的介质分数包括:根据所述目标主体数、所述非目标主体数以及所述介质类型,按照如下第一计算公式,计算获得所述目标介质的介质分数;其中,A表示目标主体,表示非目标主体,xi表示非目标主体使用的第i个目标介质;m表示使用所述目标介质的非目标主体数;n表示使用所述目标介质的目标主体数;F(m,n)表示被m个非目标主体以及n个目标主体使用,且属于所述介质类型的介质的介质数量。5.根据权利要求4所述的方法,其特征在于,在所述非目标主体数小于第一阈值且所述目标主体数小于第二阈值时,F(m,n)从所述训练数据中统计获得;在所述非目标主体数小于第一阈值且所述目标主体数大于第二阈值;或者在所述非目标主体数大于第一阈值且所述目标主体小于第二阈值时:其中,αn以及βn分别为将F(m,n)进行拟合获得的斜率以及截距;所述第一计算公式具体为:在所述非目标主体数大于第一阈值且所属目标主体数大于第二阈值时:F(m,n)≈1;所述第一计算公式具体为:6.根据权利要求2所述的方法,其特征在于,所述将各个目标介质的介质分数进行汇总,获得所述检测主体的主体分数包括:将各个目标介质的介质分数进行汇总,按照如下第二计算公式,计算获得所述检测主体的主体分数;其中,k表示所述检测主体使用的目标介质总个数;X表示所述训练数据中的非目标主体数,Y所述训练数据中的目标主体数,表示目标介质xi的介质分数。...

【专利技术属性】
技术研发人员:王萌
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1