【技术实现步骤摘要】
一种风险文本归纳处理方法及装置
[0001]本专利技术涉及数据处理领域,具体而言,涉及一种风险文本归纳处理方法及装置。
技术介绍
[0002]在分析行业中各机构的风险文本时,现有方法是通过人工进行筛选,效率比较低,速度很慢。
[0003]针对相关技术中通过人工筛选分析风险文本,效率低且速度慢的问题,尚未提出解决方案。
技术实现思路
[0004]本专利技术实施例提供了一种风险文本归纳处理方法及装置,以至少解决相关技术中通过人工筛选分析风险文本,效率低且速度慢的问题。
[0005]根据本专利技术的一个实施例,提供了一种风险文本归纳处理方法,包括:
[0006]获取待处理文本;
[0007]将所述待处理文本输入预先训练好的事件抽取模型,得到所述事件抽取模型输出的风险事件;
[0008]根据预先存储的语义关系规则补全所述风险事件的实体关系,得到风险文本归纳结果。
[0009]可选地,在获取所述待处理文本之前,所述方法还包括:
[0010]对输入的多个风险文本数据 ...
【技术保护点】
【技术特征摘要】
1.一种风险文本归纳处理方法,其特征在于,包括:获取待处理文本;将所述待处理文本输入预先训练好的事件抽取模型,得到所述事件抽取模型输出的风险事件;根据预先存储的语义关系规则补全所述风险事件的实体关系,得到风险文本归纳结果。2.根据权利要求1所述的方法,其特征在于,在获取所述待处理文本之前,所述方法还包括:对输入的多个风险文本数据进行预处理,得到所述待处理文本。3.根据权利要求1所述的方法,其特征在于,将所述待处理文本输入预先训练好的事件抽取模型,得到所述事件抽取模型输出的风险事件包括:将所述待处理文本转换为词向量;基于业务要求的风险事件集,将所述词向量输入所述事件抽取模型,得到所述事件抽取模型输出的所述风险事件。4.根据权利要求3所述的方法,其特征在于,基于所述业务要求的风险事件集,将所述词向量输入所述事件抽取模型,得到所述事件抽取模型输出的所述风险事件包括:基于所述业务要求的风险事件集,通过所述事件抽取模型对所述词向量进行事件触发词抽取,得到事件触发词集;通过所述事件抽取模型对所述事件触发词集进行事件与时间归一化处理;通过所述事件抽取模型对归一化处理后的所述事件触发词集进行事件关系词的事件实体抽取,得到所述风险事件。5.根据权利要求4所述的方法,其特征在于,基于所述业务要求的风险事件集,通过所述事件抽取模型对所述词向量进行事件触发词抽取,得到事件触发词集包括:基于所述风险事件集中的每一类风险的语料,通过所述事件抽取模型从所述词向量中选取所述每一类风险的语料的高频词汇,并形成每一类风险的事件触发词,得到所述事件触发词集。6.根据权利要求1所述的方法,其特征在于,根据所述预先存储的语义关系规则补全所述风险事件的实体关系,得到所述风险文本归纳结果包括:基于频繁子图挖掘算法或归纳逻辑编程算法,利用所述风险事件的事件实...
【专利技术属性】
技术研发人员:马小龙,苗森,李岩,杨心翮,
申请(专利权)人:中国光大银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。