一种面向失信主体行为的信用风险监测方法技术

技术编号:33558666 阅读:28 留言:0更新日期:2022-05-26 22:55
本发明专利技术公开了一种面向失信主体行为的信用风险监测方法,包括:获取失信事件数据;根据失信事件数据聚类获得失信事件基本类型;根据失信事件基本类型确定失信舆情的类别标签和关键词语料库;利用关键词语料库中的关键词进行LDA主题模型训练;对关键词语料库中的关键词进行处理,存入数据库中;将数据库中的失信舆情信息进行清洗;对清洗后失信舆情信息进行自然语言处理,生成智能标签。本发明专利技术应用构建的信用关键词库和机器学习爬虫智能爬取相关失信舆情信息,提高了失信舆情信息爬取的精度和广度。利用数据质量平台对舆情信息进行清洗,并利用NLP文本处理技术对清洗后的信息生成各种舆情所需的智能标签,达到了失信舆情信息的快速、准确的分析。准确的分析。准确的分析。

【技术实现步骤摘要】
一种面向失信主体行为的信用风险监测方法


[0001]本专利技术涉及信用风险监测
,特别涉及一种面向失信主体行为的信用风险监测方法。

技术介绍

[0002]互联网信用信息获取和分析是近几年随着数据库和网络的发展而发展起来的一个研究领域,主要包括信用信息的获取,存储,清洗和分析。而失信舆情作为政府监管部门对失信风险判断的重要依据,需要尽可能广泛的获取特定领域,特定行业,特定地区的信用主体有关的失信舆情信息,进而作出相应的处理。失信舆情信息的处理包括:相关舆情信息的失信领域类别,地域,情感分析,关键词,摘要,传播路径,传播媒体等信息。
[0003]目前对于失信舆情的信息抓取,多采用传统舆情抓取的方法,利用领域专家提供的舆情关键词进行信息爬取,然后存入数据库,并进行舆情信息清洗,然后进行情感分析。而针对失信舆情信息,由于专家提供的领域关键词往往十分有限,导致抓取的信息不准确。而且,简单的情感分析不足以满足信用监管部门对失信舆情的要求。
[0004]因此,如何有效、快速、准确的抓取特定的失信舆情新闻事件,如何快速生成情感、领域、地域本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向失信主体行为的信用风险监测方法,其特征在于,包括:获取失信事件数据;根据所述失信事件数据聚类获得失信事件基本类型;根据所述失信事件基本类型确定失信舆情的类别标签和相应的关键词语料库;利用所述关键词语料库中的关键词进行LDA主题模型训练,以扩充所述关键词语料库;对所述关键词语料库中的关键词进行处理,存入数据库中;将所述数据库中的失信舆情信息导入数据质量处理平台,由所述数据质量处理平台对所述失信舆情信息进行清洗;对清洗后所述失信舆情信息进行自然语言处理,生成智能标签。2.根据权利要求1所述的一种面向失信主体行为的信用风险监测方法,其特征在于,还包括:对所述清洗后的失信舆情信息进行聚类处理;根据聚类结果进行时间演化分析和媒体热度分析。3.根据权利要求2所述的一种面向失信主体行为的信用风险监测方法,其特征在于,所述根据聚类结果进行时间演化分析和媒体热度分析,包括:对同一类别的失信舆情信息,按照报道时间、报道媒体、报道次数进行统计,生成相应的统计图表。4.根据权利要求1所述的一种面向失信主体行为的信用风险监测方法,其特征在于,所述根据所述失信事件数据聚类获得失信事件基本类型,包括:利用jieba分词以及K

means算法对所述失信事件数据进行聚类,获得所述失信事件基本类型。5.根据权利要求...

【专利技术属性】
技术研发人员:鲁红军
申请(专利权)人:云基华海信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1