当前位置: 首页 > 专利查询>湘江实验室专利>正文

一种基于隐私保护的金融文本可信度评分方法技术

技术编号:41143351 阅读:19 留言:0更新日期:2024-04-30 18:12
本申请涉及一种基于隐私保护的金融文本可信度评分方法,该方法包括:收集金融文本测试样本,并计算出金融文本测试样本中各文本测试数据对应的机器综合评分;将所有机器综合评分输入至训练好的回归器,得到各文本测试数据对应的可信度评分;以可信度评分的加权距离最小和为目标函数,并设置约束条件;根据目标函数构造马尔科夫决策;采用深度强化学习求解马尔科夫决策,求解出可信度评分的加权距离最小时的可信度中心点,并以可信度中心点对应的可信度评分作为文本测试数据的文本可信度评分;根据文本可信度评分和预设的可信度阈值,确定文本测试数据的可信度情况并对文本测试数据进行可信度标记。

【技术实现步骤摘要】

本申请涉及金融文本可信度评分,特别是涉及一种基于隐私保护的金融文本可信度评分方法


技术介绍

1、金融文本数量庞大且内容丰富多元,涉及众多领域和层面,确定评分标准和指标面临困难;数据来源的多样性带来了质量和偏见问题,对评分的公正性和一致性构成了挑战,且目前的可信度评分方法主要依赖人工标注的数据,但这一过程的成本高昂且质量难以保证。现已有研究者尝试利用机器学习方法来自动评估金融文本的可信度;然而,这些方法也存在一些局限性,例如需要大量标注数据作为训练集,但这类数据通常难以获取或成本高昂。


技术实现思路

1、基于此,有必要针对现有金融文本可信度评分方法中存在的数据稀疏、标注困难、泛化能力不足等问题,提供一种基于隐私保护的金融文本可信度评分方法。

2、本专利技术提供了一种基于隐私保护的金融文本可信度评分方法,该方法包括:

3、s1:收集金融文本测试样本,并计算出金融文本测试样本中各文本测试数据对应的机器综合评分;

4、s2:将所有所述机器综合评分输入至训练好的回归器,得到各文本测本文档来自技高网...

【技术保护点】

1.一种基于隐私保护的金融文本可信度评分方法,其特征在于,包括:

2.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述计算出金融文本测试样本中各文本测试数据对应的机器综合评分包括:

3.根据权利要求2所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述金融文本测试样本属于金融文本词库;所述金融文本词库包括金融产品词库、金融实体机构词库、专业技术词库、媒体单位词库、地址信息集;

4.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,将词语同时匹配所述金融产品词库、所述金融实体机构词库以及所述专业技术词...

【技术特征摘要】

1.一种基于隐私保护的金融文本可信度评分方法,其特征在于,包括:

2.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述计算出金融文本测试样本中各文本测试数据对应的机器综合评分包括:

3.根据权利要求2所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述金融文本测试样本属于金融文本词库;所述金融文本词库包括金融产品词库、金融实体机构词库、专业技术词库、媒体单位词库、地址信息集;

4.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,将词语同时匹配所述金融产品词库、所述金融实体机构词库以及所述专业技术词库对应的样本作为金融文本训练样本;计算金融文本训练样本中各文本训练数据对应的机器综合评分,并通过专家计算出金融文本训练样本中各文本训练数据对应的人工可信度评分;将所述文本训练数据对应的机器综合评分作为输入,将所述文本训练数据对应的人工可信度评分作为输出,训练所述文本训练数据对应的所述回归器,直至收敛,得到所述文本...

【专利技术属性】
技术研发人员:张震田志平杨积春张金传方小蝶高卓航陈杰彭晗徐雪松
申请(专利权)人:湘江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1