一种非法集资企业识别方法、装置及计算机存储介质制造方法及图纸

技术编号:32121772 阅读:17 留言:0更新日期:2022-01-29 19:08
本发明专利技术公开一种非法集资企业识别方法、装置及计算机存储介质。其中,该方法包括:获取全部企业所有共同信息和所有非共同信息;全部企业包括:原有企业和新增企业;将每个共同信息和每个非共同信息进行特征工程化,得到全部企业的所有特征值;对新增企业的共同信息和非共同信息的类别标记为训练类别;根据新增企业的特征值对归属于同一训练类别的原有企业的特征值进行模型训练,得到预测模型;通过预测模型,对新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果。该方法因使用归属于同一训练类别的原有企业的特征值进行模型训练,从而能够给出准确性很高的非法集资企业的识别结果。够给出准确性很高的非法集资企业的识别结果。够给出准确性很高的非法集资企业的识别结果。

【技术实现步骤摘要】
一种非法集资企业识别方法、装置及计算机存储介质


[0001]本专利技术涉及企业非法集资
,具体而言,涉及一种非法集资企业识别方法、装置及计算机存储介质。

技术介绍

[0002]非法集资是违反国家金融管理法律规定,向社会公众(包括单位和个人)吸收资金的行为。非法集资行为需同时具备非法性、公开性、利诱性、社会性四个特征要件。具体地,非法性:未经有关部门依法批准或者借用合法经营的形式吸收资金;公开性:通过媒体、推介会、传单、手机短信等途径向社会公开宣传;利诱性:承诺在一定期限内以货币、实物、股权等方式还本付息或者给付回报;社会性:向社会公众即社会不特定对象吸收资金。非法集资严重干扰了社会正常的经济、金融秩序,使参与者遭受经济损失,甚至生活陷入困境,极易引发社会不稳定和大量社会治安问题,甚至引发局部地区的社会动荡。如何根据大量的企业信息建立预测模型并判断企业是否存在非法集资风险,对监管部门、企业合作伙伴、投资者都具有一定的价值。
[0003]现有技术采用两种方法进行非法集资企业识别:第一、使用资金类流转的数据进行非法集资企业识别,由于资金类流转的数据,企业、银行或者第三方监管单位不会对其公开在互联网当中,所以使用资金流水相关的分析方案存在局限性;第二、通过行业专家经验对企业使用规则进行非法集资企业识别,由于行业专家经验有限,做不到全面、准确的识别。
[0004]针对现有技术中使用资金类流转的数据进行非法集资企业识别存在局限性,以及通过行业专家经验对企业使用规则进行非法集资企业识别,做不到全面、准确识别的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例中提供一种非法集资企业识别方法、装置及计算机存储介质,以解决现有技术中使用资金类流转的数据进行非法集资企业识别存在局限性,以及通过行业专家经验对企业使用规则进行非法集资企业识别,做不到全面、准确识别的问题。
[0006]为达到上述目的,一方面,本专利技术提供了一种非法集资企业识别方法,该方法包括:通过第一公开渠道获取全部企业所有共同信息,以及通过第二公开渠道获取全部企业所有非共同信息;其中,所述全部企业包括:原有企业和新增企业;将每个所述共同信息和每个所述非共同信息进行特征工程化,得到所述全部企业的所有特征值;对所述新增企业的共同信息和非共同信息的类别标记为训练类别;根据所述新增企业的特征值对归属于同一所述训练类别的所述原有企业的特征值进行模型训练,得到预测模型;通过所述预测模型,对所述新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果。
[0007]可选的,所述共同信息包括:文本信息和数值信息;所述文本信息至少包括:公开
基础信息和年报信息;所述数值信息至少包括:裁判文书数量、注册商标数量和专利数量;所述非共同信息至少包括:新闻舆情信息、公司发布新闻、招聘信息、广告信息和企业举报。
[0008]可选的,所述将每个所述共同信息和每个所述非共同信息进行特征工程化,得到所述全部企业的所有特征值包括:将每个所述文本信息进行分类,并对每个分类进行特征工程化,得到与每个分类一一对应的第一特征值;以及将每个所述数量信息进行特征工程化,得到与所述数量信息一一对应的第二特征值;将每个所述非共同信息进行分类,并对每个分类进行特征工程化,得到与每个分类一一对应的第三特征值。
[0009]可选的,根据所述新增企业的特征值对归属于同一所述训练类别的所述原有企业的特征值进行模型训练,得到预测模型包括:当所述新增企业的非共同信息的类别在所述原有企业的非共同信息的类别中不存在时,不对该类别进行处理。
[0010]可选的,所述通过所述预测模型,对所述新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果之后,包括:通过模型解释包对所述预测模型进行解析,得到所述新增企业的每个特征值对预测值的贡献值;将所述新增企业的每个特征值对预测值的贡献值反馈给用户。
[0011]另一方面,本专利技术提供了一种非法集资企业识别装置,包括:获取单元,用于通过第一公开渠道获取全部企业所有共同信息,以及通过第二公开渠道获取全部企业所有非共同信息;其中,所述全部企业包括:原有企业和新增企业;特征工程化单元,用于将每个所述共同信息和每个所述非共同信息进行特征工程化,得到所述全部企业的所有特征值;标记单元,用于对所述新增企业的共同信息和非共同信息的类别标记为训练类别;结果预测单元,用于根据所述新增企业的特征值对归属于同一所述训练类别的所述原有企业的特征值进行模型训练,得到预测模型;通过所述预测模型,对所述新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果。
[0012]可选的,所述共同信息包括:文本信息和数值信息;所述文本信息至少包括:公开基础信息和年报信息;所述数值信息至少包括:裁判文书数量、注册商标数量和专利数量;所述非共同信息至少包括:新闻舆情信息、公司发布新闻、招聘信息、广告信息和企业举报。
[0013]可选的,所述特征工程化单元包括:第一特征工程化子单元,用于将每个所述文本信息进行分类,并对每个分类进行特征工程化,得到与每个分类一一对应的第一特征值;以及将每个所述数量信息进行特征工程化,得到与所述数量信息一一对应的第二特征值;第二特征工程化子单元,用于将每个所述非共同信息进行分类,并对每个分类进行特征工程化,得到与每个分类一一对应的第三特征值。
[0014]可选的,所述一种非法集资企业识别装置还包括:解析单元,用于通过模型解释包对所述预测模型进行解析,得到所述新增企业的每个特征值对预测值的贡献值;反馈单元,用于将所述新增企业的每个特征值对预测值的贡献值反馈给用户。
[0015]另一方面,本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的非法集资企业识别方法。
[0016]本专利技术的有益效果:
[0017]本专利技术提供了一种非法集资企业识别方法,该方法获取全部企业的所有共同信息和所有非共同信息;全部企业包括:原有企业和新增企业;对新增企业的共同信息和非共同信息的类别标记为训练类别;根据新增企业的特征值对归属于同一训练类别的原有企业的
特征值进行模型训练,得到预测模型,从而通过预测模型,对新增企业的共同信息和非共同信息对应的特征值进行预测,该方法进行非法集资企业识别具有很高的准确性。进一步的,本专利技术通过模型解释包对预测模型进行解析,得到新增企业的每个特征值对预测值的贡献值;将贡献值反馈给用户,该过程可以反映出每一个企业中的各个特征对识别结果的影响,方便了用户得知各个特征是否异常。
附图说明
[0018]图1是本专利技术实施例提供的一种非法集资企业识别方法的流程图;
[0019]图2是本专利技术实施例提供的特征工程化的流程图;
[0020]图3是本专利技术实施例提供的一种非法集资企业识别装置的结构示意图;
[0021]图4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非法集资企业识别方法,其特征在于,包括:通过第一公开渠道获取全部企业所有共同信息,以及通过第二公开渠道获取全部企业所有非共同信息;其中,所述全部企业包括:原有企业和新增企业;将每个所述共同信息和每个所述非共同信息进行特征工程化,得到所述全部企业的所有特征值;对所述新增企业的共同信息和非共同信息的类别标记为训练类别;根据所述新增企业的特征值对归属于同一所述训练类别的所述原有企业的特征值进行模型训练,得到预测模型;通过所述预测模型,对所述新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果。2.根据权利要求1所述的方法,其特征在于:所述共同信息包括:文本信息和数值信息;所述文本信息至少包括:公开基础信息和年报信息;所述数值信息至少包括:裁判文书数量、注册商标数量和专利数量;所述非共同信息至少包括:新闻舆情信息、公司发布新闻、招聘信息、广告信息和企业举报。3.根据权利要求2所述的方法,其特征在于,所述将每个所述共同信息和每个所述非共同信息进行特征工程化,得到所述全部企业的所有特征值包括:将每个所述文本信息进行分类,并对每个分类进行特征工程化,得到与每个分类一一对应的第一特征值;以及将每个所述数量信息进行特征工程化,得到与所述数量信息一一对应的第二特征值;将每个所述非共同信息进行分类,并对每个分类进行特征工程化,得到与每个分类一一对应的第三特征值。4.根据权利要求1所述的方法,其特征在于,根据所述新增企业的特征值对归属于同一所述训练类别的所述原有企业的特征值进行模型训练,得到预测模型包括:当所述新增企业的非共同信息的类别在所述原有企业的非共同信息的类别中不存在时,不对该类别进行处理。5.根据权利要求1所述的方法,其特征在于,所述通过所述预测模型,对所述新增企业的共同信息和非共同信息对应的特征值进行预测,得到新增企业是否为非法集资企业的预测结果之后,包括:通过模型解释包对所述预测模型进行解析,得到所述新增企业的每个特征值对预测值的贡献...

【专利技术属性】
技术研发人员:葛胜利魏国富夏玉明
申请(专利权)人:上海观安信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1