识别互联网金融借贷企业经营异常的方法、终端设备及存储介质技术

技术编号:17780943 阅读:25 留言:0更新日期:2018-04-22 10:07
本发明专利技术公开一种基于知识图谱识别互联网金融借贷企业经营异常的方法,S1:构建互联网金融借贷企业的企业知识库,S2:从企业知识库中,按照RDF三元组的结构,提取各种知识库中的实体名称和关系名称,存入知识图谱数据库中,形成包含企业基础信息实体、企业招聘信息实体、企业投资标的实体、企业网络舆情实体和企业财务信息实体的企业实体数据库,S3:在企业实体数据库中,将同一个企业的多个实体的数据库进行关联,构建该企业的企业信息知识图谱,S4:选用适宜的机器学习的算法,从企业信息知识图谱中抽取和各种经营数据有关的知识数据,从多个维度对互联网金融借贷企业进行经营异常的风险预测,识别出经营异常的互联网金融借贷企业。

【技术实现步骤摘要】
识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
本专利技术涉及信息处理
,具体是一种基于知识图谱识别互联网金融借贷企业经营异常的方法、终端设备及存储介质。
技术介绍
随着互联网和金融行业的快速发展,出现了大量互联网金融借贷企业,与传统金融企业相比,借助于互联网的快速传播,互联网金融借贷企业的运营效率更高,经营模式更灵活,尤其对促进小微企业的经济发展有积极意义。另一方面,互联网金融借贷企业受到的金融监管要较传统金融企业弱,也不需要什么固定资产投资,初始投入资本的门槛低,目前已经发展出来的业务模式包括小额贷款公司、P2P理财、担保公司、投资管理顾问等形式。传统的金融企业主要依据财务数据,比如销售收入、流动资产、负债总额等作为评价企业运营状况的指标。而互联网金融借贷企业很多本身也是小微企业,财务制度不完善,存在部分企业通过构建虚假投资标的诈骗投资者的情况。考虑到互联网金融借贷企业主要的业务都是通过网上交易完成,因而可以通过从互联网上获取互联网金融借贷企业经营相关的各种数据,来对其经营状况进行评价。互联网上可以获取的互联网金融借贷企业数据多种多样,包含交易数据、新闻数据、财务数据等,数据的格式和标准也不统一,不易对数据进行提取及分析。
技术实现思路
为了解决上述问题,本专利技术提供一种基于知识图谱识别互联网金融借贷企业经营异常的方法、终端设备及存储介质,通过从互联网上采集企业的注册信息、交易数据、招聘信息、舆情信息、财务数据等,采用资源描述框架(RDF,ResourceDescriptionFramework)的形式将不同结构的企业数据进行抽取形成企业的知识数据,共同构建企业的知识图谱信息,并结合机器学习的方法,能从多个维度建立起企业经营异常的识别模型,从而有效提升对经营异常互联网金融企业的识别能力。此外,通过所建的企业知识图谱,还能识别出与异常经营企业存在法律连带责任的企业,以便进行预警。本专利技术一种基于知识图谱识别互联网金融借贷企业经营异常的方法,包括如下步骤:S1:获取互联网金融借贷企业的企业基础信息、招聘信息、投资标的信息、网络舆情信息和财务信息,构建其包括企业基础信息知识库、企业招聘信息知识库、企业投资标的知识库、企业网络舆情知识库和企业财务信息知识库的企业知识库,进入S2步骤;S2:从S1所构建的企业知识库中,按照RDF三元组的结构,提取各种知识库中的实体名称和关系名称,存入知识图谱数据库中,形成包含企业基础信息实体、企业招聘信息实体、企业投资标的实体、企业网络舆情实体和企业财务信息实体的企业实体数据库,进入S3步骤;S3:在S2所建立的企业实体数据库中,将同一个企业的多个实体的数据库进行关联,构建该企业的企业信息知识图谱,进入S4步骤;S4:分析能够评价互联网金融借贷企业经营异常的各种经营数据,根据各种经营数据的特点,选用适宜的机器学习的算法,从S3中建立的企业信息知识图谱中抽取和各种经营数据有关的知识数据,包括应用自然语言处理算法和分类算法,从S3中建立的企业信息知识图谱中,抽取企业基础信息实体中的内容,按地理位置或资金规模对企业进行分类,给企业加上地理位置或资金规模的标签;应用自然语言处理算法,从S3中建立的企业信息知识图谱中,抽取企业基础信息实体中的司法协助信息和企业变更信息,给企业加上是否存在司法违约或变更的标签;应用正则匹配算法和分类算法,从S3中建立的企业信息知识图谱中,抽取企业招聘信息实体中的内容,划分企业在行业中的薪酬福利等级,作为企业综合实力的参考;应用时间序列算法和回归算法,从S3中建立的企业信息知识图谱中,抽取企业投资标的实体中的内容,预测企业投资标的的发布规模和投资收益;应用自然语言处理算法,从S3中建立的企业信息知识图谱中,抽取企业网络舆情实体中的内容,并进行文本的语义分析和情感分析;应用分类算法,从S3中建立的企业信息知识图谱中,抽取企业财务信息实体中的内容,进行企业盈利能力的分类对比。基于以上构建的多种分析模型,分析获取能够评价互联网金融借贷企业经营异常的各种经营数据,从多个维度对互联网金融借贷企业进行经营异常的风险预测,识别出经营异常的互联网金融借贷企业。进一步的,还包括S5:根据S3中建立的企业信息知识图谱,将与S4中已识别出的经营异常的互联网金融借贷企业具有法律连带责任的企业列入经营异常预警名单,并进行推送。进一步的,S1中,通过爬虫抓取来获取互联网金融借贷企业的企业基础信息、招聘信息、投资标的信息、网络舆情信息和财务信息。进一步的,S4中,机器学习的算法包括:正则匹配算法、分类算法、自然语言处理算法、时间序列算法和回归算法。进一步的,S4中,评价互联网金融借贷企业经营异常的各种经营数据包括:企业存在违法经营行为、主要负责人离职、高级岗位离职率高、企业薪酬明显过高、企业发布的投资标的存在投资收益或投资规模明显高于预测值、企业获得的负面评价或负面新闻的数量高于设定的阈值或企业的营收能力低于设定的阈值。本专利技术一种基于知识图谱识别互联网金融借贷企业经营异常的终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现基于知识图谱识别互联网金融借贷企业经营异常的方法的步骤。本专利技术一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现基于知识图谱识别互联网金融借贷企业经营异常的方法的步骤。本专利技术的有益效果:1.通过采用资源描述框架(RDF,ResourceDescriptionFramework)的形式可以将不同结构的企业数据进行抽取形成企业的知识数据,以便对各种知识数据进行融合,形成企业的知识图谱。再结合机器学习的算法,从而可以从多个维度对互联网金融借贷企业的运营状况进行描述,识别出经营异常的互联网金融借贷企业。2.能够将已识别出的经营异常的互联网金融借贷企业具有法律连带责任的企业列入经营异常预警名单,并进行推送。附图说明图1为本专利技术实施例一的方法流程图;图2为本专利技术实施例一的企业基础信息知识库示意图;图3为本专利技术实施例一的企业招聘信息知识库示意图;图4为本专利技术实施例一的企业投资标的知识库示意图;图5为本专利技术实施例一的企业网络舆情知识库示意图;图6为本专利技术实施例一的企业财务信息知识库示意图;图7为本专利技术实施例一的企业信息知识图谱示意图。具体实施方式为进一步说明各实施例,本专利技术提供有附图。这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。现结合附图和具体实施方式对本专利技术进一步说明。实施例一:请参阅图1-图7所示,本专利技术提供了一种基于知识图谱识别互联网金融借贷企业经营异常的方法,本专利技术所阐述的方法具体过程如下:S1:通过爬虫抓取来获取互联网金融借贷企业的企业基础信息、招聘信息、投资标的信息、网络舆情信息和财务信息,构建其包括企业基础信息知识库、企业招聘信息知识库、企业投资标的知识库、企业网络舆情知识库和企业财务信息知识库的企业知识库,S2:从S1所构建的企业知本文档来自技高网...
识别互联网金融借贷企业经营异常的方法、终端设备及存储介质

【技术保护点】
一种基于知识图谱识别互联网金融借贷企业经营异常的方法,其特征在于:包括如下步骤:S1:获取互联网金融借贷企业的企业基础信息、招聘信息、投资标的信息、网络舆情信息和财务信息,构建其包括企业基础信息知识库、企业招聘信息知识库、企业投资标的知识库、企业网络舆情知识库和企业财务信息知识库的企业知识库,进入S2步骤;S2:从S1所构建的企业知识库中,按照RDF三元组的结构,提取各种知识库中的实体名称和关系名称,存入知识图谱数据库中,形成包含企业基础信息实体、企业招聘信息实体、企业投资标的实体、企业网络舆情实体和企业财务信息实体的企业实体数据库,进入S3步骤;S3:在S2所建立的企业实体数据库中,将同一个企业的多个实体的数据库进行关联,构建该企业的企业信息知识图谱,进入S4步骤;S4:分析能够评价互联网金融借贷企业经营异常的各种经营数据,根据各种经营数据的特点,选用适宜的机器学习的算法,从S3中建立的企业信息知识图谱中抽取和各种经营数据有关的知识数据,包括应用自然语言处理算法和分类算法,从S3中建立的企业信息知识图谱中,抽取企业基础信息实体中的内容,按地理位置或资金规模对企业进行分类,给企业加上地理位置或资金规模的标签;应用自然语言处理算法,从S3中建立的企业信息知识图谱中,抽取企业基础信息实体中的司法协助信息和企业变更信息,给企业加上是否存在司法违约或变更的标签;应用正则匹配算法和分类算法,从S3中建立的企业信息知识图谱中,抽取企业招聘信息实体中的内容,划分企业在行业中的薪酬福利等级,作为企业综合实力的参考;应用时间序列算法和回归算法,从S3中建立的企业信息知识图谱中,抽取企业投资标的实体中的内容,预测企业投资标的的发布规模和投资收益;应用自然语言处理算法,从S3中建立的企业信息知识图谱中,抽取企业网络舆情实体中的内容,并进行文本的语义分析和情感分析;应用分类算法,从S3中建立的企业信息知识图谱中,抽取企业财务信息实体中的内容,进行企业盈利能力的分类对比;基于以上构建的多种分析模型,分析获得能够评价互联网金融借贷企业经营异常的各种经营数据,从多个维度对互联网金融借贷企业进行经营异常的风险预测,识别出经营异常的互联网金融借贷企业。...

【技术特征摘要】
1.一种基于知识图谱识别互联网金融借贷企业经营异常的方法,其特征在于:包括如下步骤:S1:获取互联网金融借贷企业的企业基础信息、招聘信息、投资标的信息、网络舆情信息和财务信息,构建其包括企业基础信息知识库、企业招聘信息知识库、企业投资标的知识库、企业网络舆情知识库和企业财务信息知识库的企业知识库,进入S2步骤;S2:从S1所构建的企业知识库中,按照RDF三元组的结构,提取各种知识库中的实体名称和关系名称,存入知识图谱数据库中,形成包含企业基础信息实体、企业招聘信息实体、企业投资标的实体、企业网络舆情实体和企业财务信息实体的企业实体数据库,进入S3步骤;S3:在S2所建立的企业实体数据库中,将同一个企业的多个实体的数据库进行关联,构建该企业的企业信息知识图谱,进入S4步骤;S4:分析能够评价互联网金融借贷企业经营异常的各种经营数据,根据各种经营数据的特点,选用适宜的机器学习的算法,从S3中建立的企业信息知识图谱中抽取和各种经营数据有关的知识数据,包括应用自然语言处理算法和分类算法,从S3中建立的企业信息知识图谱中,抽取企业基础信息实体中的内容,按地理位置或资金规模对企业进行分类,给企业加上地理位置或资金规模的标签;应用自然语言处理算法,从S3中建立的企业信息知识图谱中,抽取企业基础信息实体中的司法协助信息和企业变更信息,给企业加上是否存在司法违约或变更的标签;应用正则匹配算法和分类算法,从S3中建立的企业信息知识图谱中,抽取企业招聘信息实体中的内容,划分企业在行业中的薪酬福利等级,作为企业综合实力的参考;应用时间序列算法和回归算法,从S3中建立的企业信息知识图谱中,抽取企业投资标的实体中的内容,预测企业投资标的的发布规模和投资收益;应用自然语言处理算法,从S3中建立的企业信...

【专利技术属性】
技术研发人员:陈捷栾江霞王仁斌俞碧洪左军
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1