【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种金融专业报告表格数据自动更新方法、装置、设备及存储介质。
技术介绍
1、更新金融机构文件是指对金融机构文件中的信息进行修订、更新或修改,以反映最新的经营状况、财务状况、风险因素等方面的信息。这是一个基本的业务实践,以确保潜在投资者能够获得最新的、准确的信息,从而做出明智的投资决策。
2、更新金融机构文件的工作往往是枯燥、重复、费时的,更新的内容较多但均为模式化的内容替换,替换指定样式的句子及表格内容,更新数据、时间、金额、占比等内容。这些句子和表格内容在语义上比较相似,但又有内容上的差异,并且这种差异是不确定的。因此需要一种能够通过规则判断文本相似度进行文件内容的替换、自动替换金融机构文件内容、替代人工进行内容替换的重复性工作、提高办公效率的系统。
3、目前常采用的是挖空填补的方法,即对待修改文件内容和模版文件内容建立一一对应的映射关系,通过更新新模版的方式对旧文件内容进行更新。但这种方法存在局限性,每更新一种类型的文件即需要创建一份该类型文件对应的模版文件,建立替换的判定逻辑
...【技术保护点】
1.一种金融专业报告表格数据自动更新方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的金融专业报告表格数据自动更新方法,其特征在于,所述新旧表格相似度包括标题相似度Stitle,表格内容相似度Scell,以及表格标题、内容相似度加权分值Stitle_cell。
3.根据权利要求2所述的金融专业报告表格数据自动更新方法,其特征在于,步骤S4中计算单个旧表格与其同属同一大章节映射对的去除所有该旧表格曾经关联过、但关联失败的新表格之后的所有剩余新表格之间的新旧表格相似度的具体步骤为:
4.根据权利要求3所述的金融专业报告表格数
...【技术特征摘要】
1.一种金融专业报告表格数据自动更新方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的金融专业报告表格数据自动更新方法,其特征在于,所述新旧表格相似度包括标题相似度stitle,表格内容相似度scell,以及表格标题、内容相似度加权分值stitle_cell。
3.根据权利要求2所述的金融专业报告表格数据自动更新方法,其特征在于,步骤s4中计算单个旧表格与其同属同一大章节映射对的去除所有该旧表格曾经关联过、但关联失败的新表格之后的所有剩余新表格之间的新旧表格相似度的具体步骤为:
4.根据权利要求3所述的金融专业报告表格数据自动更新方法,其特征在于,步骤s42中计算当前旧表格与单个相似新表格之间的标题相似度stitle的具体步骤为:
5.根据权利要求4所述的金融专业报告表格数据自动更新方法,其特征在于,若当前旧表格的科目关键词与相似新表格的科目关键词完全一致,则标题匹配分值skey=1;
6.根据权利要求4所述的金融专业报告表格数据自动更新方法,其特征在于,所述新旧标题向量余弦相似度svec的计算公式为:
7.根据权利要求3或4所述的金融专业报告表格数据自动更新方法,其特征在于,若当前旧表格无标题,则将当前旧表格与相似新表格之间的标题相似度stitle置为0。
8.根据权利要求3所述的金融专业报告表格数据自动更新方法,其特征在于,步骤s42中计算当前旧表格与单个相似新表格之间的表格内容相似度scell的具体步骤为:
9.根据权利要求8所述的金融专业报告表格数据自动更新方法,其特征在于,若当前旧表格与相似新表格的所属最小章节文本均非空且两者所属最小章节文本为包含关系,如果scell_0≥tcontain_chapter,则scell=scell_0+wcontain_chapter;
10.根据权利要求8或9所述的金融专业报告表格数据自动更新方法,其特征在于,若当前旧表格与相似新表格的所属最小章节文本的差异为指定关键词时,scell=-1。
11.根据权利要求3所述的金融专业报告表格数据自动更新方法,其特征在于,步骤s5中根据计算出的新旧表格相似度值按照设定的最相似匹配规则筛选匹配满足条件的新表格的具体步骤为:
12.根据权利要求11所述的金融专业报...
【专利技术属性】
技术研发人员:冯逸阳,韩伟,王卓,王子,张健,王子豪,许婧冉,张欢,贺力源,张浩阳,马垚,
申请(专利权)人:达观数据有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。