基于模型的银行制度文本的分类方法、装置以及设备制造方法及图纸

技术编号:40560300 阅读:22 留言:0更新日期:2024-03-05 19:22
本申请实施例提供一种基于模型的银行制度文本的分类方法、装置以及设备,其中,该方法包括:获取待分类的银行制度文本;并对待分类的银行制度文本进行数据清洗处理,得到清洗后的待分类的银行制度文本;提取清洗后的待分类的银行制度文本中的关键词,得到关键词组合;将关键词组合输入至预设分类模型中,得到关键词组合的特征向量;基于预设分类模型,确定关键词组合的特征向量与每一预设的制度分类标签的向量之间的余弦相似度,确定余弦相似度最高的制度分类标签向量对应的制度分类标签,为待分类的银行制度文本的制度分类标签。可以减少时间成本;分类更加准确,可以准确的确定出待分类的银行制度文本的制度分类标签。

【技术实现步骤摘要】

本申请实施例涉及文本处理技术、自然语言处理技术以及智能模型技术,尤其涉及一种基于模型的银行制度文本的分类方法、装置以及设备


技术介绍

1、在银行中会存储银行制度文本,银行制度文本中为制定银行内部制度的文本。需要对银行制度文本进行分类,进而确定出银行制度文本的制度分类标签。例如,制度分类标签为内部日常工作类别,制度分类标签为业务工作处理类别,制度分类标签为内部管理类别,等等。

2、现有技术中,是基于人工的方式阅读银行制度文本之后,人工的确定出银行制度文本的制度分类标签。

3、但是上述方式中,人工确定银行制度文本的制度分类标签的方式,依赖于人工分类的经验,需要耗费大量的时间成本,并且分类准确率低。


技术实现思路

1、本申请实施例提供一种基于模型的银行制度文本的分类方法、装置以及设备,用以解决确定银行制度文本的制度分类标签的时间成本高、分类准确率低的问题。

2、第一方面,本申请实施例提供一种基于模型的银行制度文本的分类方法,所述方法包括:

3、获取待分类的银行制度文本文档来自技高网...

【技术保护点】

1.一种基于模型的银行制度文本的分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,对所述待分类的银行制度文本进行数据清洗处理,得到清洗后的待分类的银行制度文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述清洗后的待分类的银行制度文本中包括至少一个词语;提取所述清洗后的待分类的银行制度文本中的关键词,得到关键词组合,包括:

4.根据权利要求3所述的方法,其特征在于,每一词语的逆文档频率;为idf(t)=log(N/(nt+1));其中,t表征词语t;N为所述总数信息,nt为词语t的文本数量。p>

5.根据权...

【技术特征摘要】

1.一种基于模型的银行制度文本的分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,对所述待分类的银行制度文本进行数据清洗处理,得到清洗后的待分类的银行制度文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述清洗后的待分类的银行制度文本中包括至少一个词语;提取所述清洗后的待分类的银行制度文本中的关键词,得到关键词组合,包括:

4.根据权利要求3所述的方法,其特征在于,每一词语的逆文档频率;为idf(t)=log(n/(nt+1));其中,t表征词语t;n为所述总数信息,nt为词语t的文本数量。

5.根据权利要求3所述的方法,其特征在于,每一词语的重要性权重为其中,...

【专利技术属性】
技术研发人员:田荟双李鑫李金金
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1