债券质控相似识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:35012632 阅读:24 留言:0更新日期:2022-09-21 15:08
本发明专利技术涉及人工智能领域,公开了一种债券质控相似识别方法、装置、计算机设备及存储介质,包括:提取待发行材料中的待发行问询信息和待发行属性信息;获取内容与待发行问询信息相似的历史监管问题,将历史监管问题及其历史属性信息汇总成第一相似信息;获取标签与待发行问询信息相同的历史监管问题,将历史监管问题及其历史属性信息汇总成第二相似信息;获取与待发行属性信息关联的历史属性信息,将历史属性信息对应的历史案例信息及其历史监管问题设为第三相似信息;汇总第一相似信息、第二相似信息和第三相似信息得到相似集合,对相似条目进行排序得到相似序列。本发明专利技术提高了质控业务效率,保证了潜在问题挖掘的准确度。保证了潜在问题挖掘的准确度。保证了潜在问题挖掘的准确度。

【技术实现步骤摘要】
债券质控相似识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种债券质控相似识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]债券发行有着巨大的发展潜力和市场需求,当前债券发行大体需要经过前期准备、材料制作、申报、审核、发行五个阶段。而质控业务是提交审核材料前重要的内部审核环节,其完成一次指质核往往需要从业人员阅读厚达几十页至上百页的材料,发现其中潜在的可能被监管机构问询的问题。
[0003]然而,专利技术人发现无论是从业人员还是当前的智能平台,其挖掘债券待发行材料中的问题数量,以及深度和广度终究是有限的,无法获知历史上发行所述债券待发行材料相似的企业遇到了何种问题,并采用何种方法去解决,导致质控业务效率低下,准确度不足。

技术实现思路

[0004]本专利技术的目的是提供一种债券质控相似识别方法、装置、计算机设备及可读存储介质,用于解决现有技术存在的因无法获知历史上发行所述债券待发行材料相似的企业遇到了何种问题,并采用何种方法去解决,导致质控业务效率低下,准确度不足的问题。
[0005]为实现上述目的,本专利技术提供一种债券质控相似识别方法,包括:
[0006]接收客户端发送的待发行材料,提取所述待发行材料中的待发行问询信息和待发行属性信息;
[0007]从预置的问询库和/或热点库中获取内容与所述待发行问询信息相似的历史监管问题,将所述相似的历史监管问题及其历史属性信息汇总成第一相似信息;及
[0008]从预置的标签树中获取标签与所述待发行问询信息相同的历史监管问题,将所述相同的历史监管问题及其历史属性信息汇总成第二相似信息;
[0009]从预置的知识图谱中获取与所述待发行属性信息关联的历史属性信息,将与所述历史属性信息对应的历史案例信息,及其中历史监管问题设为第三相似信息;
[0010]汇总所述第一相似信息、所述第二相似信息和所述第三相似信息,得到至少具有一个相似条目的相似集合,将所述待发行材料与相似集合中的相似条目依次进行比对,得到表征所述待发行材料与所述相似条目之间的相似程度的比对相似值,其中,所述相似条目包括相互对应的历史监管问题和历史属性信息;
[0011]根据所述比对相似值对所述相似集合中的相似条目进行排序得到相似序列,将所述相似序列发送至所述客户端。
[0012]上述方案中,所述接收客户端发送的待发行材料之前,所述方法还包括:
[0013]获取历史案例信息,并提取所述历史案例信息中的历史监管问题和历史属性信息;
[0014]识别所述历史监管问题中的历史关键字,根据所述历史关键字构建标签树;及
[0015]对所述历史监管问题进行向量化处理得到历史词向量,汇总多个所述历史词向量形成问询库;及
[0016]根据所述历史属性信息构建表征所述历史案例信息之间关联关系的知识图谱。
[0017]上述方案中,所述接收客户端发送的待发行材料之前,所述方法还包括:
[0018]在预置的时间区间内获取多个历史案例信息,提取所述多个历史案例信息中的历史监管问题并汇总形成历史问询集合,识别所述历史问询集合中的热点问询信息并汇总形成热点库。
[0019]上述方案中,所述提取所述待发行材料中的待发行问询信息和待发行属性信息,包括:
[0020]提取所述待发行材料中的问询函并提取所述问询函中的监管问题,及将所述问询函中的监管问题设为待发行问询信息;和/或
[0021]提取所述待发行材料中的潜在问题清单,提取所述潜在问题清单中的潜在问题并将其设为所述待发行问询信息;
[0022]通过预置的正则表达式从所述待发行材料中获取行业信息、地域信息和政策信息,汇总所述行业信息、所述地域信息和所述政策信息形成所述待发行属性信息。
[0023]上述方案中,所述从预置的问询库和/或热点库中获取内容与所述待发行问询信息相似的历史监管问题,包括:
[0024]对所述待发行问询信息进行向量化处理得到待发行问询向量;
[0025]将所述待发行问询向量与所述问询库中的历史问询向量进行相似度比对,并得到表征所述待发行问询向量与所述历史问询向量之间相似程度的向量相似值;和/或
[0026]将所述待发行问询向量与所述热点库中的热点问询向量进行相似度比对,以得到表征所述待发行问询向量与所述热点问询向量之间相似程度的热点相似值;
[0027]将数值超过预置的向量相似阈值的向量相似值设为目标历史值,将相应于所述目标历史值的历史问询向量所对应的历史监管问题,设为内容与所述待发行问询信息相似的历史监管问题;和/或
[0028]将数值超过预置的热点相似阈值的热点相似值设为目标热点值,将相应于所述目标热点值的热点问询向量对应的热点问询信息,设为内容与所述待发行问询信息相似的历史监管问题;
[0029]所述从预置的标签树中获取标签与所述待发行问询信息相同的历史监管问题,包括:
[0030]提取所述待发行问询信息中的待发行关键字;
[0031]获取所述标签树中相应于所述待发行关键字的分类标签,获取相应于所述分类标签的历史监管问题;
[0032]将通过所述标签树获取到的历史监管问题设为所述标签与所述待发行问询信息相同的历史监管问题。
[0033]上述方案中,所述从预置的知识图谱中获取与所述待发行属性信息关联的历史属性信息,包括:
[0034]识别所述知识图谱中与所述待发行属性信息匹配的节点,并将所述节点设为目标
节点;
[0035]将所述知识图谱中与所述目标节点之间具有关联关系的节点设为关联节点;
[0036]将分别与所述目标节点和所述关联节点对应的历史案例信息,作为与所述待发行属性信息关联的历史属性信息。
[0037]上述方案中,所述将所述待发行材料与相似集合中的相似条目依次进行比对,得到表征所述待发行材料与所述相似条目之间的相似程度的比对相似值,包括:
[0038]提取待发行材料中的待发行属性信息和待发行问询信息,对所述待发行属性信息和所述待发行问询信息进行向量化处理得到待发行向量;
[0039]对所述相似条目中的历史属性信息和历史监管问题进行向量化处理得到相似向量;
[0040]通过预置的双塔模型对所述待发行向量和所述相似向量进行比对,以得到所述比对相似值。
[0041]所述根据所述比对相似值对所述相似集合中的相似条目进行排序得到相似序列之后,所述方法还包括:
[0042]将所述相似序列上传至区块链中。
[0043]为实现上述目的,本专利技术还提供一种债券质控相似识别装置,包括:
[0044]输入提取模块,用于接收客户端发送的待发行材料,提取所述待发行材料中的待发行问询信息和待发行属性信息;
[0045]内容标签模块,用于从预置的问询库和/或热点库中获取内容与所述待发行问询信息相似的历史监管问题,将所述相似的历史监管问题及其历本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种债券质控相似识别方法,其特征在于,包括:接收客户端发送的待发行材料,提取所述待发行材料中的待发行问询信息和待发行属性信息;从预置的问询库和/或热点库中获取内容与所述待发行问询信息相似的历史监管问题,将所述相似的历史监管问题及其历史属性信息汇总成第一相似信息;及从预置的标签树中获取标签与所述待发行问询信息相同的历史监管问题,将所述相同的历史监管问题及其历史属性信息汇总成第二相似信息;从预置的知识图谱中获取与所述待发行属性信息关联的历史属性信息,将与所述历史属性信息对应的历史案例信息,及其中历史监管问题设为第三相似信息;汇总所述第一相似信息、所述第二相似信息和所述第三相似信息,得到至少具有一个相似条目的相似集合,将所述待发行材料与相似集合中的相似条目依次进行比对,得到表征所述待发行材料与所述相似条目之间的相似程度的比对相似值,其中,所述相似条目包括相互对应的历史监管问题和历史属性信息;根据所述比对相似值对所述相似集合中的相似条目进行排序得到相似序列,将所述相似序列发送至所述客户端。2.根据权利要求1所述的债券质控相似识别方法,其特征在于,所述接收客户端发送的待发行材料之前,所述方法还包括:获取历史案例信息,并提取所述历史案例信息中的历史监管问题和历史属性信息;识别所述历史监管问题中的历史关键字,根据所述历史关键字构建标签树;及对所述历史监管问题进行向量化处理得到历史词向量,汇总多个所述历史词向量形成问询库;及根据所述历史属性信息构建表征所述历史案例信息之间关联关系的知识图谱。3.根据权利要求1所述的债券质控相似识别方法,其特征在于,所述接收客户端发送的待发行材料之前,所述方法还包括:在预置的时间区间内获取多个历史案例信息,提取所述多个历史案例信息中的历史监管问题并汇总形成历史问询集合,识别所述历史问询集合中的热点问询信息并汇总形成热点库。4.根据权利要求1所述的债券质控相似识别方法,其特征在于,所述提取所述待发行材料中的待发行问询信息和待发行属性信息,包括:提取所述待发行材料中的问询函并提取所述问询函中的监管问题,及将所述问询函中的监管问题设为待发行问询信息;和/或提取所述待发行材料中的潜在问题清单,提取所述潜在问题清单中的潜在问题并将其设为所述待发行问询信息;通过预置的正则表达式从所述待发行材料中获取行业信息、地域信息和政策信息,汇总所述行业信息、所述地域信息和所述政策信息形成所述待发行属性信息。5.根据权利要求1所述的债券质控相似识别方法,其特征在于,所述从预置的问询库和/或热点库中获取内容与所述待发行问询信息相似的历史监管问题,包括:对所述待发行问询信息进行向量化处理得到待发行问询向量;将所述待发行问询向量与所述问询库中的历史问询向量进行相似度比对,并得到表征
所述待发行问询向量与所述历史问询向量之间相似程度的向量相似值;和/或将所述待发行问询向量与所述热点库中的热点问询向量进行相似度比对,以得到表征所述待发行问询向量与所述热点问询向量之间相似程度的热点相似值;将数值超过预置的向量相似阈值的向量相似值设为目标历史值,将相应于所述目标历史值的历史问询向量所对应的历史监管问题,设为内容与所述待发行问询信息相似的历史监管问题;和/或将数值超过预置的热点相似阈值的热点相似值设为目标热...

【专利技术属性】
技术研发人员:卫雨鑫
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1