基于人工智能的目标数据检测方法、装置、设备及介质制造方法及图纸

技术编号:26378422 阅读:31 留言:0更新日期:2020-11-19 23:47
本发明专利技术涉及人工智能,提供一种基于人工智能的目标数据检测方法、装置、设备及介质,能够对目标数据集进行扩展,使模型更加准确,将扩展数据集输入至自编码器,输出衍生特征,以支持海量数据且耗时短,满足更多预测场景下对于特征的要求,以衍生特征训练预设神经网络得到检测模型进行检测,整合检测结果为目标的数据作为目标数据,进而能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题,同时也解决了传统的分类模型无法处理海量数据,特征提取困难且耗时较长,以及难易寻找时间序列或者多数据集的联合特征的问题。本发明专利技术还涉及区块链技术,检测模型及目标数据可存储于区块链。

【技术实现步骤摘要】
基于人工智能的目标数据检测方法、装置、设备及介质
本专利技术涉及人工智能
,尤其涉及一种基于人工智能的目标数据检测方法、装置、设备及介质。
技术介绍
目前,随着保险行业的飞速发展,代理人的队伍也日渐壮大,部分代理人存在代做或者代刷数据的情况(如:利用他人的设备做题等),进而产生大量虚假数据,这些虚假数据会造成较大的数据噪声,降低数据质量,进而由于真实性较低而影响数据的可用性,因此,如何进行快速且准确地目标数据检测成为了亟待解决的问题。针对上述情况,业内通常采用的解决方式是以预先设置的规则进行数据的筛选,例如:人为设置筛选原则,保留符合该原则的数据,并删除不符合该原则的数据。该方式仅依赖于人为定义的规则进行数据统计,不仅筛选效率低,且极易出错,导致最终的检测结果可靠性欠佳。另外,只利用传统的分类模型进行筛选会受限于分类模型自身的特点,进而可能导致无法处理海量数据,特征提取困难且耗时较长,以及难易寻找时间序列或者多数据集的联合特征等问题。
技术实现思路
鉴于以上内容,有必要提供一种基于人工智能的目标数据检测方法、装置、设备及介质,能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题,同时还解决了传统的分类模型无法处理海量数据,特征提取困难且耗时较长,以及难易寻找时间序列或者多数据集的联合特征等问题。一种基于人工智能的目标数据检测方法,所述基于人工智能的目标数据检测方法包括:响应于接收到的目标数据检测指令,确定目标标签;获取与待检测用户对应的待检测数据;根据所述目标标签从所述待检测数据中选择数据构建目标数据集;对所述目标数据集进行扩展处理,得到扩展数据集;将所述扩展数据集输入至预先训练的自编码器,输出衍生特征;以所述衍生特征训练预设神经网络,得到检测模型;将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;整合检测结果为目标的数据作为目标数据。根据本专利技术优选实施例,所述确定目标标签包括以下一种或者多种方式的组合:解析所述目标数据检测指令的方法体,得到所述目标数据检测指令所携带的数据,获取预设标签,以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配,并将匹配的数据确定为所述目标标签;或者获取历史目标数据,识别所述历史目标数据的关键字作为第一关键字,并计算所述第一关键字的出现频率,获取出现频率最高的第一关键字作为所述目标标签。根据本专利技术优选实施例,所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括:识别所述待检测数据中每个数据的关键字作为第二关键字;将所述待检测数据中带有相同的第二关键字的数据划分为一类,并以所述相同的第二关键字命名每个类别;配置每个类别在对应的数据中的权重;将权重大于或者等于配置权重的类别确定为对应的数据的目标类别;以所述目标类别定义对应的数据的标签;以所述目标标签在定义的标签中进行匹配,并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。根据本专利技术优选实施例,所述对所述目标数据集进行扩展处理,得到扩展数据集包括:获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;整合所述至少一个子交集中的数据,得到所述扩展数据集。根据本专利技术优选实施例,在将所述扩展数据集输入至预先训练的自编码器前,所述基于人工智能的目标数据检测方法还包括:将所述扩展数据集中的数据输入至初始自编码器进行编码处理,得到中间层;对所述中间层的数据进行解码处理,并将解码处理后的数据传递至输出层;对比所述初始自编码器的输入数据与输出数据,直至所述输入数据与所述输出数据相同,停止训练,得到所述自编码器;获取所述自编码器的中间层的数据作为所述衍生特征。根据本专利技术优选实施例,在以所述衍生特征训练预设神经网络,得到检测模型后,所述基于人工智能的目标数据检测方法还包括:从所述目标数据集中随机获取数据构建验证集;将所述验证集中的数据输入至所述检测模型中,输出第一检测结果;获取所述第一检测结果为目标的数据,并计算获取的数据在所述验证集中所占的比例;当所述比例大于或者等于配置比例时,确定所述检测模型通过验证,并将所述检测模型保存至区块链;或者当所述比例小于所述配置比例时,确定所述检测模型未通过验证,更新所述至少一个子标签,并根据更新后的至少一个子标签更新所述至少一个子数据集,以所述至少一个子数据集对所述检测模型进行优化训练。根据本专利技术优选实施例,在整合检测结果为目标的数据作为目标数据后,所述基于人工智能的目标数据检测方法还包括:计算所述目标数据在所述待检测数据中的占比;当所述占比低于配置占比时,根据所述占比生成警告信息;确定所述待检测用户的关联用户;将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。一种基于人工智能的目标数据检测装置,所述基于人工智能的目标数据检测装置包括:确定单元,用于响应于接收到的目标数据检测指令,确定目标标签;获取单元,用于获取与待检测用户对应的待检测数据;选择单元,用于根据所述目标标签从所述待检测数据中选择数据构建目标数据集;扩展单元,用于对所述目标数据集进行扩展处理,得到扩展数据集;输入单元,用于将所述扩展数据集输入至预先训练的自编码器,输出衍生特征;训练单元,用于以所述衍生特征训练预设神经网络,得到检测模型;所述输入单元,还用于将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;整合单元,用于整合检测结果为目标的数据作为目标数据。一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现所述基于人工智能的目标数据检测方法。一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述基于人工智能的目标数据检测方法。由以上技术方案可以看出,本专利技术能够响应于接收到的目标数据检测指令,确定目标标签,获取与待检测用户对应的待检测数据,根据所述目标标签从所述待检测数据中选择数据构建目标数据集,对所述目标数据集进行扩展处理,得到扩展数据集,通过数据扩展,使后续模型的训练更加准确,将所述扩展数据集输入至预先训练的自编码器,输出衍生特征,通过所述自编码器提取特征,不仅能够支持海量数据,同时特征提取的过程耗时短,且能够提取出时间序列或者多数据集的联合特征,以满足更多的预测场景下对于特征的要求,进一步以所述衍生特征训练预设神经网络,得到检测模型,将所述待检测本文档来自技高网...

【技术保护点】
1.一种基于人工智能的目标数据检测方法,其特征在于,所述基于人工智能的目标数据检测方法包括:/n响应于接收到的目标数据检测指令,确定目标标签;/n获取与待检测用户对应的待检测数据;/n根据所述目标标签从所述待检测数据中选择数据构建目标数据集;/n对所述目标数据集进行扩展处理,得到扩展数据集;/n将所述扩展数据集输入至预先训练的自编码器,输出衍生特征;/n以所述衍生特征训练预设神经网络,得到检测模型;/n将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;/n整合检测结果为目标的数据作为目标数据。/n

【技术特征摘要】
1.一种基于人工智能的目标数据检测方法,其特征在于,所述基于人工智能的目标数据检测方法包括:
响应于接收到的目标数据检测指令,确定目标标签;
获取与待检测用户对应的待检测数据;
根据所述目标标签从所述待检测数据中选择数据构建目标数据集;
对所述目标数据集进行扩展处理,得到扩展数据集;
将所述扩展数据集输入至预先训练的自编码器,输出衍生特征;
以所述衍生特征训练预设神经网络,得到检测模型;
将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;
整合检测结果为目标的数据作为目标数据。


2.如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,所述确定目标标签包括以下一种或者多种方式的组合:
解析所述目标数据检测指令的方法体,得到所述目标数据检测指令所携带的数据,获取预设标签,以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配,并将匹配的数据确定为所述目标标签;或者
获取历史目标数据,识别所述历史目标数据的关键字作为第一关键字,并计算所述第一关键字的出现频率,获取出现频率最高的第一关键字作为所述目标标签。


3.如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括:
识别所述待检测数据中每个数据的关键字作为第二关键字;
将所述待检测数据中带有相同的第二关键字的数据划分为一类,并以所述相同的第二关键字命名每个类别;
配置每个类别在对应的数据中的权重;
将权重大于或者等于配置权重的类别确定为对应的数据的目标类别;
以所述目标类别定义对应的数据的标签;
以所述目标标签在定义的标签中进行匹配,并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。


4.如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,所述对所述目标数据集进行扩展处理,得到扩展数据集包括:
获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;
计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;
整合所述至少一个子交集中的数据,得到所述扩展数据集。


5.如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,在将所述扩展数据集输入至预先训练的自编码器前,所述基于人工智能的目标数据检测方法还包括:
将所述扩展数据集中的数据输入至初始自编码器进行编码处理,得到中间层;
对所述中间层的数据进行解码处理,并将解码处理后的数据传递至输出层;
对比所述初始...

【专利技术属性】
技术研发人员:张宪桐
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1