【技术实现步骤摘要】
文本分类管理方法、装置、终端及可读存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种文本分类管理方法、装置、终端及可读存储介质。
技术介绍
[0002]自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。自然语言处理领域中的文本分类管理在实际中是一项重要且有意义的任务,很多公司、企业都通过其来确定内部文本的类别,实现文本分类管理。
[0003]当前,各种用于文本分类管理任务的神经网络算法层出不穷,但这些算法由于丢失了文本中词出现的先后顺序信息,仅将词语符号化,没有考虑词之间的语义联系,而难以提取到文本全局特征,使得分文分类不准确。并且,由于内部文本数据的特殊性,一方面,不同企业,不同公司的写法习惯不尽相同,甚至同一企业/公司的不同人面对同一类别的文本也能写出风格迥异的文本;另一方面,内部文本有着非常丰富的行业信息,行业的专有名词频繁地出现在各类文本中,造成了干扰,导致 ...
【技术保护点】
【技术特征摘要】
1.一种文本分类管理方法,其特征在于,所述文本分类管理方法包括:接收待分类文本,并将所述待分类文本转换为多源信息文本,其中,所述多源信息文本至少包括正文文本、后缀文本、标题文本和其他信息文本;调用预设分类模型对所述多源信息文本进行编码处理,获得多源信息张量,并基于所述预设分类模型中的感受野模块对所述多源信息张量进行处理,获得感受野输出数据,其中,所述预设分类模型基于多源信息融合与注意力机制所构建形成;将所述感受野输出数据传输到所述预设分类模型的注意力机制层,基于所述注意力机制层对所述感受野输出数据进行处理,识别所述待分类文本所归属的文本类别,并对所述待分类文本进行分类管理。2.如权利要求1所述的文本分类管理方法,其特征在于,所述对所述待分类文本进行分类管理的步骤包括:判断所述文本类别是否为加密类别,若为加密类别,则读取与所述文本类别对应的加密等级;根据与所述加密等级对应的加密规则,对所述待分类文本进行加密,并查找所述文本类型对应的存储位置;将所述待分类文本传输到所述存储位置存储,以对所述待分类文本进行分类管理。3.如权利要求1所述的文本分类管理方法,其特征在于,所述基于所述注意力机制层对所述感受野输出数据进行处理,识别所述待分类文本所归属的文本类别的步骤包括:基于所述预设识别模型对所述感受野输出数据进行拼接,得到拼接结果数据传输到所述注意力机制层,结合所述预设识别模型中的门控循环单元处理,获得至少一个类型标识;根据所述类型标识,对预设类型标识与预设文本类别之间的对应关系进行查找,确定所述对应关系中与所述类型标识对应的目标文本类别;将所述目标文本类别识别为所述待分类文本归属的文本类别,并在所述类型标识为多个时,基于多个所述类型标识对应的概率大小,对所述待分类文本识别的多个文本类别标识类别权重。4.如权利要求1所述的文本分类管理方法,其特征在于,所述识别所述待分类文本所归属的文本类别,并对所述待分类文本进行分类管理的步骤之后包括:当接收到对所述待分类文本的查询请求时,读取与所述查询请求对应请求账号的权限等级;判断所述权限等级是否支持查看所述待分类文本,若支持查看所述待分类文本,则将所述待分类文本传输到所述请求账号;若不支持查看所述待分类文本,则判定所述查询请求是否携带有效的审批信息,若携带所述审批信息,则将所述待分类文本传输到所述请求账号;若未携带所述审批信息,则向所述请求账号输出拒绝查询信息。5.如权利要求1所述的文本分类管理方法,其特征在于,所述调用预设分类模型对所述多源信息文本进行编码处理,获得多源信息张量的步骤包括:调用预设分类模型对每一所述多源信息文本按照预设分词规则进行分词处理,获得与每一所述多源信息文本对应的分词组,并对每一所述...
【专利技术属性】
技术研发人员:詹作保,杨天培,陈科研,
申请(专利权)人:广州永链信息技术有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。