一种信息风险等级五级分类方法及系统技术方案

技术编号:16756727 阅读:78 留言:0更新日期:2017-12-09 02:43
本发明专利技术提出了一种信息风险等级五级分类方法及系统,包括:建立风险信息数据库,根据所述风险信息数据库中的风险数据建立数据训练评分模型;接收用户输入的关键词,根据所述关键词在所述风险信息数据库中查找对应的风险数据,并以不同数据领域对上述查找到的风险数据进行划分呈现;将与关键词对应的风险数据,依据所述数据训练评分模型设定的风险等级,分别以各个风险等级形式对风险数据进行罗列显示,以提供给用户查看,以有所述用户根据对提示的警报和负向风险数据,采取防范措施。本发明专利技术实现了更全面的风险信息检索和输出,实现了风险信息检索领域“检索即结果”的实用目的。

A five level classification method and system for information risk grade

The invention provides a system and information, risk level five classification methods include: the establishment of risk information database is established according to the data, training data of the risk score model of risk information in the database; keywords receive user input, according to the risk data corresponding to the keywords in the risk information in the database to find the risk data and in different areas of the data to find the division will present; and risk data corresponding to the keywords, the training data set based on the scoring model the risk level of each risk level, respectively to form the risk data list display, to provide users with the user view, according to the prompt alert and negative to risk data, take preventive measures. The invention realizes the more comprehensive risk information retrieval and output, and realizes the practical purpose of \retrieval results\ in the field of risk information retrieval.

【技术实现步骤摘要】
一种信息风险等级五级分类方法及系统
本专利技术涉及互联网
,特别涉及一种信息风险等级五级分类方法及系统。
技术介绍
在大数据兴起之前,商业银行等传统金融机构,主流风控策略是以央行征信报告以及本行内的交易信息,主体自行提供的财务信息等为主要数据源,辅以最高院的主体涉诉信息,以专家经验或专家规则为评判策略。而这些信息相对滞后并且数量不全,往往会使银行在信审时漏掉大量重要风险线索;在贷款后难以实时发现风险问题,作出及时的处理方案。随着互联时代的到来,在消费、投资、商业合作等领域,大众越来越习惯通过网络来收集特定客体的风险信息,诸如法律纠纷、消费者投诉、曝光台等信息,以达到筛选风险对象,降低行为风险的目的。但是随着互联网发展,通过传统搜索引擎或政府网站来检索目标客体风险信息的方式,已经不能满足大众对于风险信息的检索需求。一方面,国内主要搜索引擎,诸如百度、搜狗、360等搜索网站,其收录内容重复且有限,并能够通过特定的优化手段,将负面信息稀释和沉底,使大众难以检索到有效风险信息。另一方面,大量未被主要搜索引擎收录的负面信息,广泛的分布在各个网络站点,人力难以完整收集。以涉诉信息为例,最高法院网站收录的涉诉信息仅不到3000万条,其他涉诉信息广泛的分布在各地方法院网站之中,很难通过人力进行完整收集。因此,随着大数据时代的到来,越来越多的大数据企业开始提供越来越多种类的风险信息在线检索服务。不过目前市场上的风险信息检索服务,大多仍停留在类百度的瀑布流信息呈现方式,但仍需要检索方对检索数据进行大量的专业分析工作,才能实现检索价值。市场缺少能够直接提供风险数据细分和风险信息标识等专业服务的互联网风险信息检索提炼技术。
技术实现思路
本专利技术的目的旨在至少解决所述技术缺陷之一。为此,本专利技术的目的在于提出一种信息风险等级五级分类方法及系统。为了实现上述目的,本专利技术的实施例提供一种信息风险等级五级分类方法,包括如下步骤:步骤S1,建立风险信息数据库,其中,所述风险信息数据库存储有各个企业的相关风险信息,根据所述风险信息数据库中的风险数据建立数据训练评分模型,其中,所述数据训练评分模型将所述风险信息数据库中的风险数据划分多个风险等级,其中,所述多个风险等级包括:警报、负向、中性、正向和利好五个等级;步骤S2,接收用户输入的关键词,根据所述关键词在所述风险信息数据库中查找对应的风险数据,并以不同数据领域对上述查找到的风险数据进行划分呈现;步骤S3,将步骤S2中的与关键词对应的风险数据,依据所述数据训练评分模型设定的风险等级,分别以各个风险等级形式对风险数据进行罗列显示,以提供给用户查看,以有所述用户根据对提示的警报和负向风险数据,采取防范措施。进一步,在所述步骤S1中,所述风险信息数据库中的风险信息,包括:涉诉信息、工商信息、税务信息、媒体信息、上市公司、冻结查封环保信息、食品药品监督、质检信息、卫生信息、社会信息、知识产权、招投标、招聘信息、低压信息、网贷黑名单、央行银监和车管所。进一步,在所述步骤S1中,对所述风险信息数据库中的风险数据进行特征分析,获取最优数据子集,并采用规则归纳的机器学习方法进行训练,以区分数据的属性,并在确定数据的等级分类后,对该数据添加对应的等级标签。进一步,在所述步骤S3之后,对同一领域下不同数据维度对应的风险数据进行呈现,其中,所述数据维度包括:裁判文书、执行公告、失信公告、法院公告、案件流程、开庭公告、司法曝光台、司法拍卖、破产信息、起诉书、抗诉书、不起诉决定书、刑事申述、检察院法律文书、听证公告、送达公告、悬赏公告、减刑假释和其他公告。进一步,还包括如下步骤:对设置等级标签后的风险数据进行复核校正。本专利技术实施例的信息风险等级五级分类系统,包括:数据训练评分模型模块、关键词查找模块、风险等级划分模块、数据呈现模块,其中,所述数据训练评分模型模块用于建立风险信息数据库,其中,所述风险信息数据库存储有各个企业的相关风险信息,根据所述风险信息数据库中的风险数据建立数据训练评分模型,其中,所述数据训练评分模型将所述风险信息数据库中的风险数据划分多个风险等级,其中,所述多个风险等级包括:警报、负向、中性、正向和利好五个等级;所述关键词查找模块用于接收用户输入的关键词,根据所述关键词在所述风险信息数据库中查找对应的风险数据,并以不同数据领域对上述查找到的风险数据通过所述数据程序模块进行划分呈现;所述风险等级划分模块用于将与关键词对应的风险数据,依据所述数据训练评分模型设定的风险等级,分别以各个风险等级形式对风险数据进行罗列显示,以提供给用户查看,以有所述用户根据对提示的警报和负向风险数据,采取防范措施。进一步,所述风险信息数据库中的风险信息,包括:涉诉信息、工商信息、税务信息、媒体信息、上市公司、冻结查封环保信息、食品药品监督、质检信息、卫生信息、社会信息、知识产权、招投标、招聘信息、低压信息、网贷黑名单、央行银监和车管所。进一步,所述数据训练评分模型模块对所述风险信息数据库中的风险数据进行特征分析,获取最优数据子集,并采用规则归纳的机器学习方法进行训练,以区分数据的属性,并在确定数据的等级分类后,对该数据添加对应的等级标签。进一步,所述数据呈现模块对同一领域下不同数据维度对应的风险数据进行呈现,其中,所述数据维度包括:裁判文书、执行公告、失信公告、法院公告、案件流程、开庭公告、司法曝光台、司法拍卖、破产信息、起诉书、抗诉书、不起诉决定书、刑事申述、检察院法律文书、听证公告、送达公告、悬赏公告、减刑假释和其他公告。进一步,对设置等级标签后的风险数据进行复核校正。根据本专利技术实施例的信息风险等级五级分类方法及系统,采取的信息风险等级五级分类技术,有效解决了风险信息检索中,信息重复、信息嘈杂、信息读取提取难度大、信息权重不明、信息风险等级不明等难题,不但可以实现检索条件叠加,检索内容有效性更强,而且通过对目标内容的整合和提炼,对其风险等级、关键词、标题、内容摘要、相关条数进行梳理呈现,极大提高了检索者对信息的理解效率。本专利技术有效实现了“检索即结果”的搜索目的,对于每一项被检索风险信息,都进行了风险等级标注,让检索方对检索内容一目了然,重点鲜明突出。本专利技术通过创新性的检索结果呈现方式来进行外部呈现。检索者在搜索框输入相关的关键词,检索结果通过去重提炼,按照风险等级的高低依次排列后,得到的每一条搜索结果都含有风险等级评定、信息类型、信息细分维度、关键信息提炼等内容。以裁判文书为例,每一条被检索到的裁判文书都包含有风险等级、信息类型、审核时间、处理机构、原告、案由等内容,极大提高了检索者对信息的理解效率。另外,检索者还可以根据具体数据类型,对检索数据进行超过100种的数据细分,达到细分维度数据的精准到达。本专利技术区别于传统主流搜索引擎的检索特点,通过对监控频道的全面信息采集和智能清洗,实现了更全面的风险信息检索和输出。单条信息风险等级标识和核心摘要生成,以及特定关键词风险报告自动生成的技术实现,更方便了使用者对信息的理解和使用,通过对检索信息的多重智能处理,很好的实现了风险信息检索领域“检索即结果”的实用目的。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到本文档来自技高网
...
一种信息风险等级五级分类方法及系统

【技术保护点】
一种信息风险等级五级分类方法,其特征在于,包括如下步骤:步骤S1,建立风险信息数据库,其中,所述风险信息数据库存储有各个企业的相关风险信息,根据所述风险信息数据库中的风险数据建立数据训练评分模型,其中,所述数据训练评分模型将所述风险信息数据库中的风险数据划分多个风险等级,其中,所述多个风险等级包括:警报、负向、中性、正向和利好五个等级;步骤S2,接收用户输入的关键词,根据所述关键词在所述风险信息数据库中查找对应的风险数据,并以不同数据领域对上述查找到的风险数据进行划分呈现;步骤S3,将步骤S2中的与关键词对应的风险数据,依据所述数据训练评分模型设定的风险等级,分别以各个风险等级形式对风险数据进行罗列显示,以提供给用户查看,以有所述用户根据对提示的警报和负向风险数据,采取防范措施。

【技术特征摘要】
1.一种信息风险等级五级分类方法,其特征在于,包括如下步骤:步骤S1,建立风险信息数据库,其中,所述风险信息数据库存储有各个企业的相关风险信息,根据所述风险信息数据库中的风险数据建立数据训练评分模型,其中,所述数据训练评分模型将所述风险信息数据库中的风险数据划分多个风险等级,其中,所述多个风险等级包括:警报、负向、中性、正向和利好五个等级;步骤S2,接收用户输入的关键词,根据所述关键词在所述风险信息数据库中查找对应的风险数据,并以不同数据领域对上述查找到的风险数据进行划分呈现;步骤S3,将步骤S2中的与关键词对应的风险数据,依据所述数据训练评分模型设定的风险等级,分别以各个风险等级形式对风险数据进行罗列显示,以提供给用户查看,以有所述用户根据对提示的警报和负向风险数据,采取防范措施。2.如权利要求1所述的信息风险等级五级分类方法,其特征在于,在所述步骤S1中,所述风险信息数据库中的风险信息,包括:涉诉信息、工商信息、税务信息、媒体信息、上市公司、冻结查封环保信息、食品药品监督、质检信息、卫生信息、社会信息、知识产权、招投标、招聘信息、低压信息、网贷黑名单、央行银监和车管所。3.如权利要求1所述的信息风险等级五级分类方法,其特征在于,在所述步骤S1中,对所述风险信息数据库中的风险数据进行特征分析,获取最优数据子集,并采用规则归纳的机器学习方法进行训练,以区分数据的属性,并在确定数据的等级分类后,对该数据添加对应的等级标签。4.如权利要求1所述的信息风险等级五级分类方法,其特征在于,在所述步骤S3之后,对同一领域下不同数据维度对应的风险数据进行呈现,其中,所述数据维度包括:裁判文书、执行公告、失信公告、法院公告、案件流程、开庭公告、司法曝光台、司法拍卖、破产信息、起诉书、抗诉书、不起诉决定书、刑事申述、检察院法律文书、听证公告、送达公告、悬赏公告、减刑假释和其他公告。5.如权利要求3所述的信息风险等级五级分类方法,其特征在于,还包括如下步骤:对设置等级标签后的风险数据进行复核校正。6.一种信息风险等级五级分类系统,其特征在于...

【专利技术属性】
技术研发人员:高强顾海英曹清杨
申请(专利权)人:北京鼎泰智源科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1