识别虚假信息的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26304687 阅读：31 留言：0更新日期：2020-11-10 20:01

本发明专利技术公开了一种识别虚假信息的方法、装置、电子设备及存储介质。所述方法包括：获得待识别信息，以及所述待识别信息的用户已发布的多个历史信息；根据所述用户对所述待识别信息进行的多次操作，获得所述待识别信息对应的信息动作特征；根据所述用户对已发布的所述多个历史信息进行的多次操作，获得用户行为特征；根据所述信息动作特征和所述用户行为特征，确定所述待识别信息是否为虚假信息。采用本发明专利技术技术方案可以提高虚假信息的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
识别虚假信息的方法、装置、电子设备及存储介质
本专利技术涉及信息处理
，尤其涉及一种识别虚假信息的方法、装置、电子设备及存储介质。
技术介绍
随着互联网的发展，人们越来越习惯利用互联网发布一些信息或浏览一些信息以便办理日常的业务等。例如，以招聘网站为例，用户需要在招聘网站发布招聘信息以进行招聘业务，或者发布求职信息以获得合适的工作。又以房屋中介网站为例，商户或房主可以在网站上发布房源信息，以进行房屋售卖或房屋出租。但是，实际中，在上述网站上经常会出现不实的虚假信息，例如出现招聘信息虚假、房源虚假等。目前，在识别这些信息是否虚假信息时，一般是对这些信息本身包含的内容进行提取，通过对内容的识别判断该信息是否是虚假的信息。但是，此种虚假信息识别方式的准确率较低。
技术实现思路
鉴于上述问题，本专利技术实施例提供一种识别虚假信息的方法、装置、电子设备及存储介质，旨在解决相关技术中存在虚假信息识别的准确率较低的问题。为了解决上述技术问题，本专利技术采取以下方案实现：第一方面，本专利技术...

【技术保护点】
1.一种识别虚假信息的方法，其特征在于，所述方法包括：/n获得待识别信息，以及所述待识别信息的用户已发布的多个历史信息；/n根据所述用户对所述待识别信息进行的多次操作，获得所述待识别信息对应的信息动作特征；/n根据所述用户对已发布的所述多个历史信息进行的多次操作，获得用户行为特征；/n根据所述信息动作特征和所述用户行为特征，确定所述待识别信息是否为虚假信息。/n

【技术特征摘要】
1.一种识别虚假信息的方法，其特征在于，所述方法包括：
获得待识别信息，以及所述待识别信息的用户已发布的多个历史信息；
根据所述用户对所述待识别信息进行的多次操作，获得所述待识别信息对应的信息动作特征；
根据所述用户对已发布的所述多个历史信息进行的多次操作，获得用户行为特征；
根据所述信息动作特征和所述用户行为特征，确定所述待识别信息是否为虚假信息。

2.根据权利要求1所述的方法，其特征在于，根据所述用户对所述待识别信息的多次操作，获得所述信息动作特征，包括：
读取所述用户对所述待识别信息进行第一预设操作的操作记录，其中，所述第一预设操作包括以下一种或多种：修改操作、刷新操作、关闭操作；
根据所述操作记录，确定所述用户对所述待识别信息进行所述第一预设操作的频率和次数，以得到所述信息动作特征。

3.根据权利要求1或2所述的方法，其特征在于，根据所述用户对已发布的所述多个历史信息进行的多次操作，获得用户行为特征，包括：
确定所述多个历史信息中每个历史信息对应的行为特征；
对所述多个历史信息各自对应的行为特征进行聚合，得到所述用户行为特征。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：
获得所述用户在预设时间段内进行第二预设操作的参数值，所述第二预设操作包括以下一种或多种：登陆操作、注册操作、新增已发布信息、对已发布信息的修改操作、对已发布信息的刷新操作、对已发布信息的关闭操作；
获得所述用户在所述预设时间段内针对不同场景的已发布信息的类别数量和占比；
获得所述用户在预设时间段内的已发布信息的总数与在预设时间段外的已发布信息的总数的比例；
对所述多个历史信息各自对应的行为特征进行聚合，得到所述用户行为特征，包括：
将对所述多个历史信息各自对应的行为特征进行聚合所得到的聚合结果和以上至少一者，确定为所述用户行为特征。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：
对所述用户的属性参数值进行解析，获得用户属性特征；
根据所述信息动作特征和所述用户行为特征，确定所述待识别信息是否为虚假信息，包括：
根据所述信息动作特征、所述用户行为特征以及所述用户属性特征，确定所述待识别信息是否为虚假信息。

6.根据权利要求1所述的方法，其特征在于，根据所述信息动作特征和所述用户行为特征，确定所述待识别信息是否为虚假信息，包括：
将所述信息动作特征和所述用户行为特征输入第一虚假信息识别模型；
采用决策树算法，利用所述第一虚假信息识别模型对所述信息动作特征和所述用户行为特征分别进行分类；
根据分类结果得到所述第一虚假识别模型输出的虚假度得分，以确定所述待识别信息是否为虚假信息；
其中，所述第一虚假信息识别模型是以多个携带标签的信息样本为训练样本，对基于决策树算法的预设模型进行训练得到的，每个信息样本携带的标签表征该信息是否是虚假信息。

7.根据权利要求5所述的方法，其特征在于，根据所述信息动作特征、所述用户行为特征以及所述用户属性特征，确定所述待识别信息是否为虚假信息，包括：
将所述信息动作特征、所述用户行为特征以及所述用户属性特征，输入第二虚假信息识别模型；
采用决策树算法，利用所述第二虚假信息识别模型对所述信息动作特征、所述用户行为特征和所述用户属性特征分别进行分类；
根据分类结果得到所述第二虚假识别模型输出的虚假度得分，以确定所述待识别信息是否为虚假信息；
其中，所述第二虚假信息识别模型是以多个信息样本为训练样本，对基于决策树算法的预设模型进行训练得到的，每个信息样本携带用于表征该信息是否是虚假信息的标签，且每个信息样本携带发布该样本信息的用户的用户属性特征。

8.根据权利要求1所述的方法，其特征在于，在根据所述信息动作特征、所述用户行为特征，确定所述待识别信息是否为虚假信息之后，所述方法还包括：
在确定所述待识别信息不为虚假信息，且所述待识别信息未发布时，对所述待识别信息进行发布；
在确定所述待识别信息为虚假信息，且所述待识别信息已发布时，将所述待识别信息的访问权限设置为禁止访问。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：
在将所述待识别信息的访问权限设置为禁止访问之后，在再次接收到所述用户发送的新的信息时，识别所述新的信息是否为虚假信息；
在对所述待识别信息进行发布之后，在再次接收到所述用户发送的新的信息时，将所述新的信息标记为免识别信息并进行发布。

10.一种识别虚假信息的装置，其特征在于，所述装置包括：
信息获得模块，用于获得待识别信息，以及所述待识别信息的用户已发布的多个历史信息；
第一行为特征获得模块，用于根据所述用户对所述待识别信息进行的多...

【专利技术属性】
技术研发人员：郑智献，史忠伟，
申请(专利权)人：五八有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人