网络信息识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：34446499 阅读：13 留言：0更新日期：2022-08-06 16:42

本发明专利技术公开了一种网络信息识别方法、装置、计算机设备及存储介质，方法包括：提取目标信息的文本数据；解析文本数据，得到文本数据的特征标签，特征标签包括情绪特征和类别特征；获取与类别特征对应的至少一个子类集合，并将子类集合作为对应目标信息的验证集合；获取情绪特征、类别特征及验证集合的权重值；基于权重值得到目标信息为虚假信息或真实信息的验证结果。本发明专利技术通过目标信息的类别特征提取与目标信息相同类别的子类集合，并筛选子类集合及相似信息，避免诈骗人更换欺诈话术或号码等行为导致无法对目标信息进行识别判断，同时通过分类可获取目标信息的信息类别，最后通过加权计算获取验证结果，进而获得目标信息的真假性及真假概率。真假性及真假概率。真假性及真假概率。

全部详细技术资料下载

【技术实现步骤摘要】
网络信息识别方法、装置、计算机设备及存储介质

[0001]本专利技术涉及数据处理的
，尤其涉及一种网络信息识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着移动通信技术的不断发展，移动终端如手机、iPAD等变得越来越普及。但在移动通信技术给人们的生活带来便利的同时，也给犯罪活动带来了方便，如电话欺诈、网络聊天欺诈等。特别对于老年人和未成年人群体更容易上当受骗，给人们的生活造成很大的影响。
[0003]目前，针对电信欺诈的防范措施，主要是通过收集虚假信息如诈骗号码、谣言信息等，建立一个虚假信息数据库，在接收新信息时通过与数据库中对比以识别信息是否为虚假信息。然而，当数据库存储有大量虚假信息时，若每次接收新信息都遍历数据库进行对比，可能造成系统运行缓慢影响信息识别效率的现象发生。同时，若诈骗人更改信息如更换欺诈话术、更换欺诈号码等进行继续行骗，则无法与数据库中数据进行匹配，则无法达到防欺诈效果，并且现有技术中仅能识别出当前信息是否为虚假信息，并不能识别出具体的虚假类型。

技术实现思路

[0004]本专利技术的目的是提供一种网络信息识别方法、装置、计算机设备及存储介质，用于解决现有技术存在的问题。
[0005]为实现上述目的，本专利技术提供一种网络信息识别方法，包括：
[0006]提取目标信息的文本数据；
[0007]解析所述文本数据，得到所述文本数据对应的特征标签，所述特征标签包括情绪特征和类别特征；
[0008]获取与所述类别特征对应的至少一...

【技术保护点】

【技术特征摘要】
1.一种网络信息识别方法，其特征在于，包括：提取目标信息的文本数据；解析所述文本数据，得到所述文本数据对应的特征标签，所述特征标签包括情绪特征和类别特征；获取与所述类别特征对应的至少一个子类集合，并将所述子类集合作为对应所述目标信息的验证集合；获取所述情绪特征、类别特征及验证集合的权重值；基于所述权重值得到所述目标信息的验证结果，所述验证结果用于表征所述目标信息为虚假信息或真实信息。2.根据权利要求1所述的网络信息识别方法，其特征在于，所述解析所述文本数据，得到所述文本数据对应的特征标签，所述特征标签包括情绪特征和类别特征，包括：基于预设的关键字从所述文本数据中提取对应字段；当同属一个分类的所述关键字提取的所述字段的次数大于预设的阈值时，将所述分类对应的属性作为所述目标信息的特征标签，所述属性用于表征情绪特征和类别特征。3.根据权利要求1所述的网络信息识别方法，其特征在于，所述获取与所述类别特征对应的至少一个子类集合，包括：从预设的集合关系表中提取所述类别特征对应的子类集合；所述集合关系表中预先存储有多个类别特征以及多个所述类别特征对应的子类集合的对应关系。4.根据权利要求1所述的网络信息识别方法，其特征在于，所述子类集合包括多个第一历史信息；所述将多个所述子类集合作为对应所述目标信息的验证集合，包括：提取多个所述子类集合中的多个所述第一历史信息；对多个所述第一历史信息进行去重处理，得到多个第二历史信息；将多个所述第二历史信息作为所述验证集合。5.根据权利要求4所述的网络信息识别方法，其特征在于，所述将多个所述第二历史信息作为所述验证集合，包括：分别获取多个所述第二历史信息与所述目标信息的相似值；对所述相似值进行降序排列，...

【专利技术属性】
技术研发人员：戴冰波，卫雨鑫，
申请(专利权)人：平安资产管理有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人