账户识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28209971 阅读:16 留言:0更新日期:2021-04-24 14:44
本公开关于一种账户识别方法、装置、电子设备及存储介质,所述方法包括获取针对于待检测账户的多个文本反馈路径下的文本反馈信息;将文本反馈信息输入预设的文本信息识别模型,利用文本信息识别模型确定文本反馈信息的文本特征;基于文本特征确定文本反馈信息的预测概率;预测概率为文本反馈信息属于描述待检测账户的目标行为的信息的概率;获取第一信息数量,若第一信息数量满足筛选条件,确定待检测账户为存在目标行为的目标账户;其中,第一信息数量为预测概率大于或等于第一概率阈值的文本反馈信息的信息数量。本公开提供的账户识别方法可以提高账户识别的准确性。别方法可以提高账户识别的准确性。别方法可以提高账户识别的准确性。

【技术实现步骤摘要】
账户识别方法、装置、电子设备及存储介质


[0001]本公开涉及互联网
,尤其涉及一种账户识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,出现了通过采集账户的行为信息对账户进行识别的技术,该技术可以通过采集需要进行识别的待检测账户发出的行为信息,如账户发表的言论等,来确定该账户是否存在某种行为。例如可以通过采集账户针对某件商品发出的言论宣传信息,以识别该账户是否存在对该商品进行类似夸大宣传商品的功效,或者描述的商品信息与实际商品信息不符等虚假宣传行为。
[0003]相关技术中,通常是基于待检测账户发出的行为信息对待检测账户进行识别,然而,仅仅利用待检测账户的账户行为信息进行单方面的账户识别,账户识别的准确性较低。

技术实现思路

[0004]本公开提供一种账户识别方法、装置、电子设备及存储介质,以至少解决相关技术中账户识别准确性较低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供了一种账户识别方法,包括:
[0006]获取针对于待检测账户的多个文本反馈路径下的文本反馈信息;
[0007]将所述文本反馈信息输入预设的文本信息识别模型,利用所述文本信息识别模型确定所述文本反馈信息的文本特征;
[0008]基于所述文本特征确定所述文本反馈信息的预测概率;所述预测概率为所述文本反馈信息属于描述所述待检测账户的目标行为的信息的概率;
[0009]获取第一信息数量,若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户;其中,所述第一信息数量为所述预测概率大于或等于第一概率阈值的文本反馈信息的信息数量。
[0010]在一示例性实施例中,所述若所述信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户,包括:若所述第一信息数量大于或等于预设的信息数量阈值,确定所述待检测账户为所述目标账户。
[0011]在一示例性实施例中,所述若所述信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户,包括:根据所述第一信息数量,以及信息总数量,确定所述第一信息数量与所述信息总数量的第一比例;所述信息总数量为所述多个文本反馈路径下的文本反馈信息的信息数量;若所述第一比例大于或等于第一比例阈值,确定所述待检测账户为所述目标账户。
[0012]在一示例性实施例中,所述方法还包括:若所述第一比例小于所述第一比例阈值,则获取第二信息数量与所述信息总数量的第二比例;其中,所述第二信息数量为所述预测概率小于所述第一概率阈值且大于或等于第二概率阈值的文本反馈信息的信息数量;所述
第二概率阈值小于所述第一概率阈值;若所述第二比例大于或等于第二比例阈值,确定所述待检测账户为所述目标账户。
[0013]在一示例性实施例中,所述若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户,包括:从预测概率大于或等于第一概率阈值的文本反馈信息中,删除由同一反馈账户针对于所述待检测账户发起的文本反馈信息中,除预测概率最大的文本反馈信息之外的文本反馈信息;若保留的不同的反馈账户针对于所述待检测账户发起的文本反馈信息的信息数量满足所述筛选条件,确定所述待检测账户为所述目标账户。
[0014]在一示例性实施例中,所述确定所述待检测账户为存在所述目标行为的目标账户之后,所述方法还包括:获取账户处理指令;利用所述账户处理指令对所述待检测账户进行处理。
[0015]在一示例性实施例中,所述账户处理指令包括预设的处理指令库中与目标画像标签与目标数量区间匹配的处理指令;其中,所述目标画像标签为所述待检测账户对应的账户画像标签,所述目标数量区间为预设的多个数量区间中与所述第一信息数量对应的数量区间。
[0016]在一示例性实施例中,所述获取针对于待检测账户的多个文本反馈路径下的文本反馈信息,包括以下至少两种:从预设的数据库中获取针对于所述待检测账户的举报文本信息;获取所述待检测账户的关联产品页面下的评论文本信息;获取所述待检测账户对应的虚拟直播间的公屏评论信息。
[0017]在一示例性实施例中,所述文本信息识别模型的获取方法包括:获取样本文本反馈信息,以及所述样本文本反馈信息对应的样本标签;所述样本标签用于标识样本文本反馈信息是否属于描述所述目标行为的信息;将所述样本文本反馈信息输入待训练的文本分类模型,利用所述文本分类模型获取所述样本文本反馈信息的样本文本特征,并基于所述样本文本特征确定所述样本文本反馈信息对应的样本概率;根据所述样本概率与所述样本标签确定所述待训练的文本分类模型的差异损失;若所述差异损失大于预设的损失阈值,则返回利用所述文本分类模型获取所述样本文本反馈信息的样本文本特征的步骤;若所述差异损失小于或等于所述损失阈值,则将所述待训练的文本分类模型作为所述文本信息识别模型。
[0018]根据本公开实施例的第二方面,提供了一种账户识别装置,包括:
[0019]信息获取单元,被配置为执行获取针对于待检测账户的多个文本反馈路径下的文本反馈信息;
[0020]特征获取单元,被配置为执行将所述文本反馈信息输入预设的文本信息识别模型,利用所述文本信息识别模型确定所述文本反馈信息的文本特征;
[0021]概率获取单元,被配置为执行基于所述文本特征确定所述文本反馈信息的预测概率;所述预测概率为所述文本反馈信息属于描述所述待检测账户的目标行为的信息的概率;
[0022]账户确定单元,被配置为执行获取第一信息数量,若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户;其中,所述第一信息数量为所述预测概率大于或等于第一概率阈值的文本反馈信息的信息数量。
[0023]在一示例性实施例中,所述账户确定单元,进一步被配置为执行若所述第一信息数量大于或等于预设的信息数量阈值,确定所述待检测账户为所述目标账户。
[0024]在一示例性实施例中,所述账户确定单元,还被配置为执行根据所述第一信息数量,以及信息总数量,确定所述第一信息数量与所述信息总数量的第一比例;所述信息总数量为所述多个文本反馈路径下的文本反馈信息的信息数量;所述信息总数量为所述多个文本反馈路径下的文本反馈信息的信息数量;若所述第一比例大于或等于第一比例阈值,确定所述待检测账户为所述目标账户。
[0025]在一示例性实施例中,所述账户确定单元,进一步被配置为执行若所述第一比例小于所述第一比例阈值,则获取第二信息数量与所述信息总数量的第二比例;其中,所述第二信息数量为所述预测概率小于所述第一概率阈值且大于或等于第二概率阈值的文本反馈信息的信息数量;所述第二概率阈值小于所述第一概率阈值;若所述第二比例大于或等于第二比例阈值,确定所述待检测账户为所述目标账户。
[0026]在一示例性实施例中,所述账户确定单元,进一步被配置为执行从预测概率大于或等于第一概率阈值的文本反馈信息中,删除由同一反馈账户针对于所述待检测账户发起的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种账户识别方法,其特征在于,包括:获取针对于待检测账户的多个文本反馈路径下的文本反馈信息;将所述文本反馈信息输入预设的文本信息识别模型,利用所述文本信息识别模型确定所述文本反馈信息的文本特征;基于所述文本特征确定所述文本反馈信息的预测概率;所述预测概率为所述文本反馈信息属于描述所述待检测账户目标行为的信息的概率;获取第一信息数量,若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户;其中,所述第一信息数量为所述预测概率大于或等于第一概率阈值的文本反馈信息的信息数量。2.根据权利要求1所述的账户识别方法,其特征在于,所述若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户,包括:若所述第一信息数量大于或等于预设的信息数量阈值,确定所述待检测账户为所述目标账户。3.根据权利要求1所述的账户识别方法,其特征在于,所述若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户,包括:根据所述第一信息数量,以及信息总数量,确定所述第一信息数量与所述信息总数量的第一比例;所述信息总数量为所述多个文本反馈路径下的文本反馈信息的信息数量;若所述第一比例大于或等于第一比例阈值,确定所述待检测账户为所述目标账户。4.根据权利要求3所述的账户识别方法,其特征在于,所述方法还包括:若所述第一比例小于所述第一比例阈值,则获取第二信息数量与所述信息总数量的第二比例;其中,所述第二信息数量为所述预测概率小于所述第一概率阈值且大于或等于第二概率阈值的文本反馈信息的信息数量;所述第二概率阈值小于所述第一概率阈值;若所述第二比例大于或等于第二比例阈值,确定所述待检测账户为所述目标账户。5.根据权利要求1所述的账户识别方法,其特征在于,所述若所述第一信息数量满足筛选条件,确定所述待检测账户为存在所述目标行为的目标账户,包括:从预测概率大于或等于第一概率阈值的文本反馈信息中,删除由同一反馈账户针对于所述待检测账户发起的文本反馈信息中,除预测概率最大的文本反馈信息之外的文本反馈信息;若保留的不同的反馈账户针对于所述待检测账户发起的文本反馈...

【专利技术属性】
技术研发人员:孙瑞娜王宇杨森梁哲豪
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1