【技术实现步骤摘要】
本申请实施例涉及文本处理技术、自然语言处理技术以及智能模型技术,尤其涉及一种基于模型的银行制度文本的分类方法、装置以及设备。
技术介绍
1、在银行中会存储银行制度文本,银行制度文本中为制定银行内部制度的文本。需要对银行制度文本进行分类,进而确定出银行制度文本的制度分类标签。例如,制度分类标签为内部日常工作类别,制度分类标签为业务工作处理类别,制度分类标签为内部管理类别,等等。
2、现有技术中,是基于人工的方式阅读银行制度文本之后,人工的确定出银行制度文本的制度分类标签。
3、但是上述方式中,人工确定银行制度文本的制度分类标签的方式,依赖于人工分类的经验,需要耗费大量的时间成本,并且分类准确率低。
技术实现思路
1、本申请实施例提供一种基于模型的银行制度文本的分类方法、装置以及设备,用以解决确定银行制度文本的制度分类标签的时间成本高、分类准确率低的问题。
2、第一方面,本申请实施例提供一种基于模型的银行制度文本的分类方法,所述方法包括:
3、获
...【技术保护点】
1.一种基于模型的银行制度文本的分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述待分类的银行制度文本进行数据清洗处理,得到清洗后的待分类的银行制度文本,包括:
3.根据权利要求1所述的方法,其特征在于,所述清洗后的待分类的银行制度文本中包括至少一个词语;提取所述清洗后的待分类的银行制度文本中的关键词,得到关键词组合,包括:
4.根据权利要求3所述的方法,其特征在于,每一词语的逆文档频率;为idf(t)=log(N/(nt+1));其中,t表征词语t;N为所述总数信息,nt为词语t的文本数量。
...【技术特征摘要】
1.一种基于模型的银行制度文本的分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述待分类的银行制度文本进行数据清洗处理,得到清洗后的待分类的银行制度文本,包括:
3.根据权利要求1所述的方法,其特征在于,所述清洗后的待分类的银行制度文本中包括至少一个词语;提取所述清洗后的待分类的银行制度文本中的关键词,得到关键词组合,包括:
4.根据权利要求3所述的方法,其特征在于,每一词语的逆文档频率;为idf(t)=log(n/(nt+1));其中,t表征词语t;n为所述总数信息,nt为词语t的文本数量。
5.根据权利要求3所述的方法,其特征在于,每一词语的重要性权重为其中,...
【专利技术属性】
技术研发人员:田荟双,李鑫,李金金,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。