一种用户生成内容UGC重复次数确定方法及装置制造方法及图纸

技术编号:20242515 阅读:36 留言:0更新日期:2019-01-29 23:23
本说明书实施例公开了一种用户生成内容UGC重复次数确定方法及装置,该方法包括:接收用户所输入的第一UGC,根据第一UGC的属性从存储UGC的数据库中获取与第一UGC属性相匹配的第二UGC组,根据第一UGC的文本内容在用户的第二UGC组内确定满足预定条件的第二UGC元素,根据确定出的满足预定条件的第二UGC元素的数量,确定第一UGC的重复次数。

【技术实现步骤摘要】
一种用户生成内容UGC重复次数确定方法及装置
本说明书涉及计算机软件
,尤其涉及一种用户生成内容UGC重复次数确定方法及装置。
技术介绍
目前,用户通常会在互联网平台发布用户生成内容(UserGeneratedContent,UGC),以此表达自己的观点。而在实际应用中,用户发布的UGC有可能违反互联网平台的发布规定,如,用户在互联网平台的评论区频繁发布广告,这样会扰乱互联网平台的秩序,破坏互联网平台的环境,给互联网平台内的其他用户造成不良体验,严重的会影响国家安全,因此,为了保证用户当前所发布的UGC符合互联网平台的发布规定,需要对用户当前所发布的UGC进行风险检测,做到必要的安全防控。进一步的,由于用户发布违规的UGC的目的通常都是为了能够传播这些违规的UGC,因此,用户会频繁重复的发送内容相关联的UGC,以用于对外传播。综上所述,可以通过确定用户当前所发布的UGC在过去被重复发布的次数,从而确定出用户当前所发布的UGC是否违反了互联网平台的发布规定。基于此,需要提供一种更有效的确定UGC重复次数的方法。
技术实现思路
本说明书实施例提供一种用户生成内容UGC重复次数确定方法及本文档来自技高网...

【技术保护点】
1.一种用户生成内容UGC重复次数确定方法,其特征在于,所述方法包括:接收用户所输入的第一UGC;根据所述第一UGC的属性从存储UGC的数据库中获取与第一UGC属性相匹配的第二UGC组;根据第一UGC的文本内容在所述用户的第二UGC组内确定满足预定条件的第二UGC元素;根据确定出的满足预定条件的第二UGC元素的数量,确定所述第一UGC的重复次数。

【技术特征摘要】
1.一种用户生成内容UGC重复次数确定方法,其特征在于,所述方法包括:接收用户所输入的第一UGC;根据所述第一UGC的属性从存储UGC的数据库中获取与第一UGC属性相匹配的第二UGC组;根据第一UGC的文本内容在所述用户的第二UGC组内确定满足预定条件的第二UGC元素;根据确定出的满足预定条件的第二UGC元素的数量,确定所述第一UGC的重复次数。2.如权利要求1所述的方法,其特征在于,所述第一UGC的属性包括:用户标识;根据所述第一UGC的属性从存储UGC的数据库中获取与第一UGC属性相匹配的第二UGC组,具体包括:根据所述第一UGC的用户标识从存储UGC的数据库中获取与所述第一UGC的用户标识相匹配的第二UGC组。3.如权利要求2所述的方法,其特征在于,所述第一UGC的属性还包括:所述第一UGC所属的场景;根据所述第一UGC的用户标识从存储UGC的数据库中获取与所述第一UGC的用户标识相匹配的第二UGC组,具体包括:根据所述第一UGC的用户标识以及所述第一UGC所属的场景,从存储UGC的数据库中获取所述第一UGC所属的场景下的与所述第一UGC的用户标识相匹配的第二UGC组。4.如权利要求3所述的方法,其特征在于,在根据所述第一UGC的用户标识以及所述第一UGC所属的场景,从存储UGC的数据库中获取所述第一UGC所属的场景下的与所述第一UGC的用户标识相匹配的第二UGC组之前,所述方法还包括:根据所述第一UGC所属的场景,获取所述第一UGC所属的场景对应的配置参数,所述配置参数作为对根据第一UGC的属性确定的第二UGC组进行修正的依据。5.如权利要求4所述的方法,其特征在于,所述配置参数包括:时间间隔;根据所述第一UGC的用户标识以及所述第一UGC所属的场景,从存储UGC的数据库中获取所述第一UGC所属的场景下的与所述第一UGC的用户标识相匹配的第二UGC组,具体包括:根据所述第一UGC的用户标识、所述第一UGC所属的场景以及所述时间间隔,从存储UGC的数据库中获取所述第一UGC所属的场景下的所述时间间隔的与所述第一UGC的用户标识相匹配的第二UGC组。6.如权利要求4或5所述的方法,其特征在于,所述配置参数还包括:筛选阈值;在根据所述第一UGC的用户标识以及所述第一UGC所属的场景,从存储UGC的数据库中获取所述第一UGC所属的场景下的与所述第一UGC的用户标识相匹配的第二UGC组之后,所述方法还包括:根据所述筛选阈值,在获取到的与所述第一UGC的用户标识相匹配的第二UGC组内选取部分第二UGC组。7.如权利要求1所述的方法,其特征在于,根据第一UGC的文本内容在所述用户的第二UGC组内确定满足预定条件的第二UGC元素,具体包括:通过相似度算法,根据第一UGC的文本内容在所述用户的第二UGC组内确定满足预定条件的第二UGC元素。8.如权利要求7所述的方法,其特征在于,通过相似度算法,根据第一UGC的文本内容在所述用户的第二UGC组内确定满足预定条件的第二UGC元素,具体包括:根据第二UGC组中的第二UGC元素的文本内容以及第一UGC的文本内容,确定所述第二UGC组中的第二UGC元素与所述第一UGC之间的最长公共子序列;确定所述第二UGC元素与所述第一UGC中的长度最短的UGC;确定所述最长公共子序列与所述长度最短的UGC的比值;根据所述比值以及预设的第一阈值,确定所述第二UGC元素与所述第一UGC是否相似;将与所述第一UGC相似的第二UGC元素作为满足预定条件的第二UGC元素。9.如权利要求8所述的方法,其特征在于,所述第一阈值包括第一子阈值和第二子阈值;根据所述比值以及所述第一阈值,确定所述第二UGC元素与所述第一UGC是否相似,具体包括:判断所述第一UGC的长度是否小于预设的第二阈值;若是,则确定所述比值不小于所述第一子阈值的所述第二UGC元素与所述第一UGC,并将所确定出的所述第二UGC元素与所述第一UGC确定为相似;若否,则确定所述比值不小于所述第二子阈值的所述第二UGC与所述第一UGC,并将所确定出的所述第二UGC元素与所述第一UGC确定为相似。10.如权利要求7所述的方法,其特征在于,通过相似度算法,根据第一UGC的文本内容在所述用户的第二UGC组内确定满足预定条件的第二UGC元素,具体包括:根据第二UGC组中的第二UGC元素的文本内容以及第一UGC的文本内容,分别确定所述用户的第二UGC组内的第二UGC元素与所述第一UGC的哈希值;根据所述第二UGC元素的哈希值与所述第一UGC的哈希值,确定所述第二UGC元素与所述第一UGC是否相似;将与所述第一UGC相似的第二UGC元素作为满足预定条件的第二UGC元素。11.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第一UGC的重复次数以及预设的防控阈值,对所述第一UGC进行安全防控。12.一...

【专利技术属性】
技术研发人员:李海亮
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1