System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于隐私保护的金融文本可信度评分方法技术_技高网
当前位置: 首页 > 专利查询>湘江实验室专利>正文

一种基于隐私保护的金融文本可信度评分方法技术

技术编号:41143351 阅读:3 留言:0更新日期:2024-04-30 18:12
本申请涉及一种基于隐私保护的金融文本可信度评分方法,该方法包括:收集金融文本测试样本,并计算出金融文本测试样本中各文本测试数据对应的机器综合评分;将所有机器综合评分输入至训练好的回归器,得到各文本测试数据对应的可信度评分;以可信度评分的加权距离最小和为目标函数,并设置约束条件;根据目标函数构造马尔科夫决策;采用深度强化学习求解马尔科夫决策,求解出可信度评分的加权距离最小时的可信度中心点,并以可信度中心点对应的可信度评分作为文本测试数据的文本可信度评分;根据文本可信度评分和预设的可信度阈值,确定文本测试数据的可信度情况并对文本测试数据进行可信度标记。

【技术实现步骤摘要】

本申请涉及金融文本可信度评分,特别是涉及一种基于隐私保护的金融文本可信度评分方法


技术介绍

1、金融文本数量庞大且内容丰富多元,涉及众多领域和层面,确定评分标准和指标面临困难;数据来源的多样性带来了质量和偏见问题,对评分的公正性和一致性构成了挑战,且目前的可信度评分方法主要依赖人工标注的数据,但这一过程的成本高昂且质量难以保证。现已有研究者尝试利用机器学习方法来自动评估金融文本的可信度;然而,这些方法也存在一些局限性,例如需要大量标注数据作为训练集,但这类数据通常难以获取或成本高昂。


技术实现思路

1、基于此,有必要针对现有金融文本可信度评分方法中存在的数据稀疏、标注困难、泛化能力不足等问题,提供一种基于隐私保护的金融文本可信度评分方法。

2、本专利技术提供了一种基于隐私保护的金融文本可信度评分方法,该方法包括:

3、s1:收集金融文本测试样本,并计算出金融文本测试样本中各文本测试数据对应的机器综合评分;

4、s2:将所有所述机器综合评分输入至训练好的回归器,得到各文本测试数据对应的可信度评分;

5、s3:以可信度评分的加权距离最小和为目标函数,并设置约束条件;根据所述目标函数构造马尔科夫决策;

6、s4:采用深度强化学习求解所述马尔科夫决策,求解出可信度评分的加权距离最小时的可信度中心点,并以可信度中心点对应的可信度评分作为文本测试数据的文本可信度评分;

7、s5:根据所述文本可信度评分和预设的可信度阈值,确定文本测试数据的可信度情况并对文本测试数据进行可信度标记。

8、有益效果:该方法以可信度评分的加权距离最小和为目标函数,并采用深度强化学习进行求解,求解出最优的可信度中心点,从而自适应样本分,为无标注样本进行可信度评分标注;该方法有效地权衡了不同数据样本的标准,提高了金融文本可信度评分的准确性和鲁棒性,同时也减少了人工标注的成本和时间。

本文档来自技高网...

【技术保护点】

1.一种基于隐私保护的金融文本可信度评分方法,其特征在于,包括:

2.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述计算出金融文本测试样本中各文本测试数据对应的机器综合评分包括:

3.根据权利要求2所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述金融文本测试样本属于金融文本词库;所述金融文本词库包括金融产品词库、金融实体机构词库、专业技术词库、媒体单位词库、地址信息集;

4.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,将词语同时匹配所述金融产品词库、所述金融实体机构词库以及所述专业技术词库对应的样本作为金融文本训练样本;计算金融文本训练样本中各文本训练数据对应的机器综合评分,并通过专家计算出金融文本训练样本中各文本训练数据对应的人工可信度评分;将所述文本训练数据对应的机器综合评分作为输入,将所述文本训练数据对应的人工可信度评分作为输出,训练所述文本训练数据对应的所述回归器,直至收敛,得到所述文本训练数据对应的训练后的回归器;训练后的回归器的数量与文本训练数据的数量对应。

<p>5.根据权利要求4所述的基于隐私保护的金融文本可信度评分方法,其特征在于,金融文本测试样本中各文本测试数据对应的可信度评分表示为:

6.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述目标函数表示为:

7.根据权利要求6所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述根据所述目标函数构造马尔科夫决策包括:

8.根据权利要求7所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述采用深度强化学习求解所述马尔科夫决策包括:

9.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,机器综合评分的计算公式为:

10.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述根据所述文本可信度评分和预设的可信度阈值,确定文本测试数据的可信度情况并对文本测试数据进行可信度标记,包括:

...

【技术特征摘要】

1.一种基于隐私保护的金融文本可信度评分方法,其特征在于,包括:

2.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述计算出金融文本测试样本中各文本测试数据对应的机器综合评分包括:

3.根据权利要求2所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述金融文本测试样本属于金融文本词库;所述金融文本词库包括金融产品词库、金融实体机构词库、专业技术词库、媒体单位词库、地址信息集;

4.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,将词语同时匹配所述金融产品词库、所述金融实体机构词库以及所述专业技术词库对应的样本作为金融文本训练样本;计算金融文本训练样本中各文本训练数据对应的机器综合评分,并通过专家计算出金融文本训练样本中各文本训练数据对应的人工可信度评分;将所述文本训练数据对应的机器综合评分作为输入,将所述文本训练数据对应的人工可信度评分作为输出,训练所述文本训练数据对应的所述回归器,直至收敛,得到所述文本...

【专利技术属性】
技术研发人员:张震田志平杨积春张金传方小蝶高卓航陈杰彭晗徐雪松
申请(专利权)人:湘江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1