【技术实现步骤摘要】
本申请涉及金融文本可信度评分,特别是涉及一种基于隐私保护的金融文本可信度评分方法。
技术介绍
1、金融文本数量庞大且内容丰富多元,涉及众多领域和层面,确定评分标准和指标面临困难;数据来源的多样性带来了质量和偏见问题,对评分的公正性和一致性构成了挑战,且目前的可信度评分方法主要依赖人工标注的数据,但这一过程的成本高昂且质量难以保证。现已有研究者尝试利用机器学习方法来自动评估金融文本的可信度;然而,这些方法也存在一些局限性,例如需要大量标注数据作为训练集,但这类数据通常难以获取或成本高昂。
技术实现思路
1、基于此,有必要针对现有金融文本可信度评分方法中存在的数据稀疏、标注困难、泛化能力不足等问题,提供一种基于隐私保护的金融文本可信度评分方法。
2、本专利技术提供了一种基于隐私保护的金融文本可信度评分方法,该方法包括:
3、s1:收集金融文本测试样本,并计算出金融文本测试样本中各文本测试数据对应的机器综合评分;
4、s2:将所有所述机器综合评分输入至训练好的
...【技术保护点】
1.一种基于隐私保护的金融文本可信度评分方法,其特征在于,包括:
2.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述计算出金融文本测试样本中各文本测试数据对应的机器综合评分包括:
3.根据权利要求2所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述金融文本测试样本属于金融文本词库;所述金融文本词库包括金融产品词库、金融实体机构词库、专业技术词库、媒体单位词库、地址信息集;
4.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,将词语同时匹配所述金融产品词库、所述金融实体机构词
...【技术特征摘要】
1.一种基于隐私保护的金融文本可信度评分方法,其特征在于,包括:
2.根据权利要求1所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述计算出金融文本测试样本中各文本测试数据对应的机器综合评分包括:
3.根据权利要求2所述的基于隐私保护的金融文本可信度评分方法,其特征在于,所述金融文本测试样本属于金融文本词库;所述金融文本词库包括金融产品词库、金融实体机构词库、专业技术词库、媒体单位词库、地址信息集;
4.根据权利要求3所述的基于隐私保护的金融文本可信度评分方法,其特征在于,将词语同时匹配所述金融产品词库、所述金融实体机构词库以及所述专业技术词库对应的样本作为金融文本训练样本;计算金融文本训练样本中各文本训练数据对应的机器综合评分,并通过专家计算出金融文本训练样本中各文本训练数据对应的人工可信度评分;将所述文本训练数据对应的机器综合评分作为输入,将所述文本训练数据对应的人工可信度评分作为输出,训练所述文本训练数据对应的所述回归器,直至收敛,得到所述文本...
【专利技术属性】
技术研发人员:张震,田志平,杨积春,张金传,方小蝶,高卓航,陈杰,彭晗,徐雪松,
申请(专利权)人:湘江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。