System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及自然语言处理,尤其是一种用户信息的分级分类方法、系统、装置及介质。
技术介绍
1、近年来,随着社会的不断发展,金融保险相关的数据量的增长速度越来越快,在这一情况下,为了能够及时、可靠地对金融保险数据进行查询、删除、添加等操作,人们对金融保险数据(主要是用户信息)提出了分级分类的需求。
2、目前,传统的对金融保险数据进行分级分类的方法,普遍是通过简单的分类算法实现,其在对用户信息进行分级分类时,分类准确率不高,同时,其需要以人工的方式对数据信息进行级别和类别标注,人工成本高。
3、因此,现有技术存在的问题还亟需解决和优化。
技术实现思路
1、本专利技术的目的在于至少一定程度上解决相关技术中存在的技术问题之一。
2、为此,本专利技术实施例的第一个目的在于提供一种用户信息的分级分类方法,该分级分类方法可以有效提高对用户信息分级分类的准确率,降低人工成本。
3、本申请实施例的第二个目的在于提供一种用户信息的分级分类系统。
4、为了达到上述技术目的,本申请实施例所采取的技术方案包括:
5、第一方面,本申请实施例提供了一种用户信息的分级分类方法,包括:
6、获取待分级分类的用户信息;
7、对所述用户信息进行预处理,得到第一信息,所述第一信息用于表征所述用户信息的关键词字段和标签字段;
8、对所述第一信息进行词向量化处理,生成标签向量空间;
9、根据预设的分级分类
10、另外,根据本申请上述实施例的用户信息的分级分类方法,还可以具有以下附加的技术特征:
11、进一步地,在本申请的一个实施例中,所述对所述待分级分类的用户信息进行预处理,得到第一信息,包括:
12、对所述用户信息进行映射查询处理,得到标签信息;
13、对所述标签信息和所述用户信息进行数据清洗处理、数据转换处理、数据标准化处理,得到中间标签信息;
14、对所述中间标签信息和所述用户信息进行全局组词处理,得到所述第一信息。
15、进一步地,在本申请的一个实施例中,所述对所述第一信息进行词向量化处理,生成标签向量空间,包括:
16、对所述第一信息进行词向量空间转换,得到标签矩阵;
17、对所述标签矩阵进行降维处理,得到所述标签向量空间。
18、进一步地,在本申请的一个实施例中,所述根据预设的分级分类矩阵,对所述标签向量空间进行相似度判断,得到分级分类结果,包括:
19、获取预设的相似度阈值;
20、对所述标签向量空间的当前向量元和所述分级分类矩阵中的第一子矩阵元进行相似度判断,得到相似度分数;
21、根据所述相似度阈值对所述相似度分数进行阈值筛选处理,得到第一相似度分数;
22、根据与最大的所述第一相似度分数对应的第二子矩阵元和当前向量元,确定所述分级分类结果;
23、其中,所述分级分类矩阵包括若干个矩阵元,每个矩阵元包括第一子矩阵元和第二子矩阵元,所述第一子矩阵元用于表征矩阵关标字段,所述第二子矩阵元用于表征与所述矩阵关标字段对应的类别和级别。
24、进一步地,在本申请的一个实施例中,所述分级分类矩阵通过以下步骤得到,包括:
25、获取标准训练集,所述标准训练集包括标准关键字数据,以及与所述标准关键字数据对应的级别数据和类别数据;
26、对所述标准训练集进行编码映射处理,得到序列数据集;
27、对所述序列数据集进行解码激活处理,得到所述分级分类矩阵。
28、进一步地,在本申请的一个实施例中,所述对所述标签向量空间的当前向量元和所述分级分类矩阵中的第一子矩阵元进行相似度判断,得到相似度分数,包括:
29、对所述标签向量空间的当前向量元和所述分级分类矩阵中的第一子矩阵元进行距离处理,得到第一距离;
30、根据所述第一距离生成所述相似度分数。
31、进一步地,在本申请的一个实施例中,所述用户信息的分级分类方法,还包括:
32、根据所述分级分类结果,获取更新数据集;
33、根据所述更新数据集对当前的分级分类矩阵进行更新,得到下一个分级分类矩阵。
34、第二方面,本申请实施例提供了一种用户信息的分级分类系统,包括:
35、获取模块,用于获取待分级分类的用户信息;
36、处理模块,用于对所述用户信息进行预处理,得到第一信息,其中,所述第一信息用于表征所述用户信息的关键词字段和标签字段;
37、向量模块,用于对所述第一信息进行词向量化处理,生成标签向量空间;
38、判断模块,用于根据预设的分级分类矩阵,对所述标签向量空间进行相似度判断,得到所述用户信息的分级分类结果。
39、第三方面,本申请实施例还提供了一种计算机装置,包括:
40、至少一个处理器;
41、至少一个存储器,用于存储至少一个程序;
42、当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述的方面所述的用户信息的分级分类方法。
43、第四方面,本申请实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现上述的方面所述的用户信息的分级分类方法。
44、本申请的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到:
45、本申请实施例所公开的一种用户信息的分级分类方法,该分级分类方法通过获取待分级分类的用户信息;对所述用户信息进行预处理,得到第一信息,所述第一信息用于表征所述用户信息的关键词字段和标签字段;对所述第一信息进行词向量化处理,生成标签向量空间;根据预设的分级分类矩阵,对所述标签向量空间进行相似度判断,得到所述用户信息的分级分类结果。该分级分类方法可以有效提高对用户信息分级分类的准确率,降低人工成本。
本文档来自技高网...【技术保护点】
1.一种用户信息的分级分类方法,其特征在于,包括:
2.根据权利要求1所述的用户信息的分级分类方法,其特征在于,所述对所述待分级分类的用户信息进行预处理,得到第一信息,包括:
3.根据权利要求1所述的用户信息的分级分类方法,其特征在于,所述对所述第一信息进行词向量化处理,生成标签向量空间,包括:
4.根据权利要求1所述的用户信息的分级分类方法,其特征在于,所述根据预设的分级分类矩阵,对所述标签向量空间进行相似度判断,得到分级分类结果,包括:
5.根据权利要求4所述的用户信息的分级分类方法,其特征在于,所述分级分类矩阵通过以下步骤得到,包括:
6.根据权利要求4所述的用户信息的分级分类方法,其特征在于,所述对所述标签向量空间的当前向量元和所述分级分类矩阵中的第一子矩阵元进行相似度判断,得到相似度分数,包括:
7.根据权利要求5所述的用户信息的分级分类方法,其特征在于,所述用户信息的分级分类方法,还包括:
8.一种用户信息的分级分类系统,其特征在于,包括:
9.一种计算机装置,其特征在于,
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由所述处理器执行时用于实现如权利要求1-7中任一项所述的用户信息的分级分类方法。
...【技术特征摘要】
1.一种用户信息的分级分类方法,其特征在于,包括:
2.根据权利要求1所述的用户信息的分级分类方法,其特征在于,所述对所述待分级分类的用户信息进行预处理,得到第一信息,包括:
3.根据权利要求1所述的用户信息的分级分类方法,其特征在于,所述对所述第一信息进行词向量化处理,生成标签向量空间,包括:
4.根据权利要求1所述的用户信息的分级分类方法,其特征在于,所述根据预设的分级分类矩阵,对所述标签向量空间进行相似度判断,得到分级分类结果,包括:
5.根据权利要求4所述的用户信息的分级分类方法,其特征在于,所述分级分类矩阵通过以下步骤得到,包括:<...
【专利技术属性】
技术研发人员:邓启志,李廷威,许东武,
申请(专利权)人:广东万丈金数信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。