【技术实现步骤摘要】
一种非法行为的识别方法及装置
本说明书涉及互联网领域,尤其涉及一种非法行为的识别方法及装置。
技术介绍
在当今信息社会环境下,信息大量涌现,信息通常承载于数据源的数据之中,则人们可以对该数据源的数据进行解析,以得到相应的信息。然而,现实生活中,往往难以保证数据源中的各数据均由合法行为生成。若一数据由非法行为生成,则该数据中较大可能的传达了不准确甚至错误的信息。导致在确定该数据传达的信息时,得到与实际不相符的信息,影响确定出的信息的有效性。由此,如何识别出数据源中的数据生成的过程中是否存在非法行为,成为亟待解决的问题。现有技术多通过人工判断的方式确定数据生成的过程中是否存在非法行为。但是,随着科技的发展,数据的量呈爆发式增长,仅依靠人工的方式进行甄别,难免存在效率低下、准确性低的问题。
技术实现思路
本说明书实施例提供一种非法行为的识别方法及装置,以部分的解决现有技术存在的上述问题。本说明书实施例采用下述技术方案:本说明书提供的一种非法行为的识别方法,所述方法包括:< ...
【技术保护点】
1.一种非法行为的识别方法,其特征在于,所述方法包括:/n针对每个数据源,采集该数据源中的对应于目标产品的数据,所述数据源包括目标数据源和样本数据源;/n根据采集的该数据源中的数据,确定所述目标产品对应于该数据源的特征值;/n根据所述目标产品对应于各样本数据源的特征值,确定所述目标产品的综合特征值;/n将所述目标产品对应于所述目标数据源的特征值,与所述目标产品的综合特征值进行比较;/n根据比较结果,识别所述目标数据源在数据生成的过程中是否存在非法行为。/n
【技术特征摘要】
1.一种非法行为的识别方法,其特征在于,所述方法包括:
针对每个数据源,采集该数据源中的对应于目标产品的数据,所述数据源包括目标数据源和样本数据源;
根据采集的该数据源中的数据,确定所述目标产品对应于该数据源的特征值;
根据所述目标产品对应于各样本数据源的特征值,确定所述目标产品的综合特征值;
将所述目标产品对应于所述目标数据源的特征值,与所述目标产品的综合特征值进行比较;
根据比较结果,识别所述目标数据源在数据生成的过程中是否存在非法行为。
2.如权利要求1所述的方法,其特征在于,采集该数据源中的对应于目标产品的数据,具体包括:
根据该数据源中的各数据与目标产品的相关程度,在该数据源的各数据中,确定出对应于所述目标产品的数据;
采集对应于所述目标产品的数据。
3.如权利要求1所述的方法,其特征在于,根据采集的该数据源中的数据,确定所述目标产品对应于该数据源的特征值,具体包括:
针对采集的该数据源中的各数据,将该数据输入语义分析模型,以通过所述语义分析模型确定该数据的情感极性;
根据该数据的情感极性,确定所述目标产品对应于该数据的评分;
根据所述目标产品对应于该数据源中各数据的评分,确定所述目标产品对应于该数据源的评分。
4.如权利要求3所述的方法,其特征在于,根据所述目标产品对应于该数据源中各数据的评分,确定所述目标产品对应于该数据源的评分,具体包括:
根据所述目标产品对应于该数据源中各数据的评分,在采集的该数据源的各数据中,确定出该数据源的有效数据;
根据该数据源的各有效数据的评分,确定所述目标产品对应于该数据源的评分。
5.如权利要求4所述的方法,其特征在于,根据该数据源的各有效数据的评分,确定所述目标产品对应于该数据源的评分,具体包括:
针对该数据源中的各有效数据,根据生成该有效数据的用户的属性,确定该有效数据的权重值;
根据该有效数据的权重值,对该有效数据的评分进行加权;
根据该数据源的各有效数据加权后的评分,确定所述目标产品对应于该数据源的评分。
6.如权利...
【专利技术属性】
技术研发人员:沈威,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。