基于大模型和上下文信息的票据风险数据分析方法及装置制造方法及图纸

技术编号:42956698 阅读:28 留言:0更新日期:2024-10-11 16:14
本发明专利技术公开了一种基于大模型和上下文信息的票据风险数据分析方法及装置,涉及票据风险数据分析领域,包括以下步骤:数据采集:收集票据的基本信息、交易记录、关联方信息、票据背书详情;数据清洗:对采集到的数据进行清洗,去除重复、错误和不完整的数据;特征工程:从清洗后的数据中构建特征,所述特征包括票据金额的统计特征、交易频率特征、关联方信用特征,设构建的特征数量为;上下文信息提取:提取票据数据中的上下文信息,包括交易的时间序列特征、交易地点的地理分布特征、关联方关系网络的拓扑特征,大模型训练;本发明专利技术通过采用分布式爬虫技术在数据采集步骤中广泛收集票据的各类详细信息,实现了数据采集的全面性和高效性。

【技术实现步骤摘要】

本专利技术涉及票据风险数据处理,更具体地说,涉及一种基于大模型和上下文信息的票据风险数据分析方法及装置


技术介绍

1、在当今的经济活动中,票据作为一种重要的金融工具,其交易规模和复杂程度不断增加。然而,随着票据业务的迅速发展,与之相关的风险问题也日益凸显。对票据风险进行准确、及时的分析和评估,对于保障金融市场的稳定、维护企业的资金安全以及促进经济的健康发展具有至关重要的意义。

2、传统的票据风险分析方法往往依赖于人工经验和简单的统计模型,存在诸多局限性。这些方法通常只能处理有限的票据数据和特征,难以充分挖掘数据中的隐藏信息和复杂关系。例如,对于票据的上下文信息,如交易的时间序列、地点分布以及关联方关系网络等,传统方法往往无法进行有效的提取和利用,导致风险评估的准确性和全面性不足。

3、在数据采集方面,传统方式可能存在采集范围狭窄、数据不完整或更新不及时的问题,难以适应票据业务的快速变化和大规模数据处理的需求。在数据清洗和特征工程阶段,缺乏高效、智能的技术手段,容易导致数据质量不高和特征构建不合理,影响后续的风险分析效果。

<本文档来自技高网...

【技术保护点】

1.一种基于大模型和上下文信息的票据风险数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大模型和上下文信息的票据风险数据分析方法,其特征在于:在数据采集步骤中,采用分布式爬虫技术,在数据清洗步骤中,应用基于规则和机器学习相结合的清洗方法。

3.根据权利要求2所述的基于大模型和上下文信息的票据风险数据分析方法,其特征在于:在分布式爬虫技术中,采用智能调度算法,根据数据源的优先级、数据更新频率、网络状况因素,动态地分配爬虫资源;在特征工程步骤中,采用生成对抗网络GAN或自动编码器AE自动生成技术,自动挖掘价值特征。

>4.根据权利要求 ...

【技术特征摘要】

1.一种基于大模型和上下文信息的票据风险数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大模型和上下文信息的票据风险数据分析方法,其特征在于:在数据采集步骤中,采用分布式爬虫技术,在数据清洗步骤中,应用基于规则和机器学习相结合的清洗方法。

3.根据权利要求2所述的基于大模型和上下文信息的票据风险数据分析方法,其特征在于:在分布式爬虫技术中,采用智能调度算法,根据数据源的优先级、数据更新频率、网络状况因素,动态地分配爬虫资源;在特征工程步骤中,采用生成对抗网络gan或自动编码器ae自动生成技术,自动挖掘价值特征。

4.根据权利要求 1 所述的基于大模型和上下文信息的票据风险数据分析方法,其特征在于:在特征工程步骤中,引入主成分分析pca进行特征降维,减少特征冗余,在上下文信息提取步骤中,运用图卷积神经网络gcn。

5.根据权利要求 4 所述的基于大模型和上下文信息的票据风险数据分析方法,其特征在于:在主成分分析中,采用基于高斯核函数或多项式核函数的主成分分析方法,用于处理非线性的数据结构,提取主成分;在运用图卷积神经网络时,定义多尺度图卷积操作,通过在不同的尺度上对图结构进行...

【专利技术属性】
技术研发人员:李方祥魏建华孙奕为张玉明赵梓杰
申请(专利权)人:深度山东数字科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1