【技术实现步骤摘要】
名称分类方法、装置、计算机设备和存储介质
[0001]本申请涉及人工智能领域,特别是涉及一种名称分类方法、装置和计算机设备。
技术介绍
[0002]由于公司名称的写法描述多种多样,并没有统一的标准化格式,例如,采用简写的形式,采用全称的形式,还有自创的公司名称的写法。而在需要基于公司名称确定具体的公司,或基于公司名称获取对应的公司信息的场景下,部分公司名称无法准确指示具体公司,例如,公司名称是纯数字组成(如“99”),或公司名称是无规律的字母组成(如“ABW”),因此基于这样的公司名称无法准确确定具体公司,或获取对应的公司信息,为便于对公司信息的筛查等,将此类公司名称定义为“无意义公司名称”,且对“无意义公司名称”进行人工审核效率较低,且基于实际场景需求(例如:基于公司名称风险评估等任务)会因为“无意义公司名称”无法准确定位具体公司,从而引入比较大的噪声干扰,影响任务效果。因此,有必要对公司名称进行识别以及分类。
[0003]目前,可以采用条件匹配的方法,即公司名称命中关键词词典里的词,确定该公司名称为“无意义公司名 ...
【技术保护点】
【技术特征摘要】
1.一种名称分类方法,其特征在于,所述方法包括:获取待分类名称,并基于所述待分类名称获取名称特征向量,所述名称特征向量包括所述待分类名称对应的文本特征向量;获取多个分类条件,并基于各所述分类条件与所述待分类名称获取分类条件特征向量,所述分类条件特征向量用于描述所述待分类名称命中各所述分类条件的结果;基于所述名称特征向量与所述分类条件特征向量,通过名称分类模型确定所述待分类名称的分类结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述待分类名称获取名称特征向量,包括:基于所述待分类名称获取包括所述待分类名称的搜索文本;基于所述搜索文本获取名称特征向量;其中,所述名称特征向量还包括所述待分类名称在所述搜索文本中的上下文特征向量。3.根据权利要求2所述的方法,其特征在于,所述基于所述搜索文本获取名称特征向量,包括:对所述搜索文本进行特征处理,以得到所述搜索文本对应的特征向量;确定所述待分类名称在所述搜索文本中的位置信息;基于所述位置信息,在所述搜索文本对应的特征向量中确定所述名称特征向量。4.根据权利要求3所述的方法,其特征在于,所述基于所述位置信息,在所述搜索文本对应的特征向量中确定所述名称特征向量,包括:所述基于所述位置信息,在所述搜索文本对应的特征向量中确定待处理名称特征向量;对所述待处理名称特征向量进行维度一致性处理,得到预设特征维度的所述名称特征向量。5.根据权利要求3所述的方法,其特征在于,所述对所述搜索文本进行特征处理,包括:对所述搜索文本进行分词处理,得到多个文本标记;对各所述文本标记进行掩码处理,并对多个掩码处理后的文本标记进行特征处理。6.权利要求3所述的方法,其特征在于,所述对所述搜索文本进行特征处理,还包括:对所述搜索文本进行分词处理,得到多个文本标记;提取各所述文本标记在所述搜索文本中的上下文信息,且基于各所述文本标记在所述搜索文本中的上下文信息对所述搜索文本进行特征处理。7.权利要求3所述的方法,其特征在于,所述名称特征向量还包括所述待分类名称在所述搜索文本中的句法结构特征向量;所述对所述搜索文本进行特征处理,还包括:对所述搜索文本进行分词处理,得到多个文本标记,并确定各所述文本标记在所述搜索文本中的句法依存信息;基于各所述文本标记在所述搜索文本中的句法依存信息生成句法依存矩阵,并对所述句法依存矩阵进行随机初始化处理。8.根据权利要求1所述的方法,其特征在于,所述基于各所述分类条件与所述待分类名
称获取分类条件特征向量,包括:基于各所述分类条件与所述待分类名称,获取各所述分类条件对应的待处理分类条件子向量,所述待处理分类条件子向量描述所述待分类名称命中所对应的分类条件的结果;对各所述分类条件对应的待处理分类条件子向量进行随机初始化处理,以获取所述分类条件特征向量。9.根据权利要求8所述的方法,其特征在于,所述对各...
【专利技术属性】
技术研发人员:铁瑞雪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。