【技术实现步骤摘要】
文本分类方法、装置、设备、存储介质及计算机程序产品
[0001]本申请涉及人工智能领域,尤其涉及一种文本分类方法、装置、设备、存储介质及计算机程序产品。
技术介绍
[0002]文本分类(text classification),又称文档分类(document classification),是自然语言处理领域中的常见任务,旨在将一个文本归类到多个预设类型中的一个或多个预设类型中,即要求能够从多个预设类型中预测出文本的文本类型。
[0003]文本分类任务被广泛应用于搜索、推荐、对话、问答等场景中,例如在搜索场景中,通常会基于对象录入的搜索文本进行意图预测,进而基于预测的意图进行进一步搜索,而文本分类任务即可以应用于搜索场景下的意图预测阶段。
[0004]由此可知,文本分类的准确性可以影响搜索任务的准确性,而现有的文本分类方法中,通常基于从文本中提取到的文本特征来实现对该文本的分类,文本分类准确性低。
技术实现思路
[0005]本申请实施例提供一种文本分类方法、装置、设备、存储介质及计算机程序产品 ...
【技术保护点】
【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:获取待进行文本分类的目标文本;以所述目标文本为搜索信息进行搜索处理,并根据搜索处理结果包括的多媒体结果对象信息,确定与所述目标文本相关联的关联文本集合;所述关联文本集合中包括一个或多个根据各个多媒体结果对象信息得到的关联文本;分别提取所述目标文本的文本特征以及各个关联文本的文本特征;根据所述目标文本的文本特征以及所述各个关联文本的文本特征,对所述目标文本的文本类型进行预测处理,得到所述目标文本的预测文本类型。2.如权利要求1所述的方法,其特征在于,所述目标文本的文本特征包括:所述目标文本中各个参照字符的编码特征,所述关联文本集合中目标关联文本的文本特征包括:所述目标关联文本中各个关联字符的编码特征;所述根据所述目标文本的文本特征以及所述各个关联文本的文本特征,对所述目标文本的文本类型进行预测处理,得到所述目标文本的预测文本类型,包括:采用各个关联文本的文本特征对所述目标文本的文本特征进行特征调整处理,得到所述目标文本的预测特征;所述目标文本的预测特征是根据所述目标文本中各个参照字符的字符预测特征得到的;根据所述目标文本的预测特征,从多个预设类型中预测得到所述目标文本的预测文本类型;其中,所述目标文本中目标参照字符的字符预测特征是根据所述目标参照字符与各个关联文本中的关联字符之间的特征相似度确定出的,所述目标参照字符与任一关联字符之间的特征相似度是根据所述目标参照字符的编码特征以及所述任一关联字符的编码特征确定出的。3.如权利要求2所述的方法,其特征在于,所述采用各个关联文本的文本特征对所述目标文本的文本特征进行特征调整处理,得到所述目标文本的预测特征,包括:根据所述目标文本中目标参照字符的编码特征,并根据所述关联文本集合中目标关联文本的各个关联字符的编码特征,确定所述目标参照字符与所述目标关联文本的各个关联字符之间的特征相似度;基于所述目标参照字符与所述目标关联文本的各个关联字符之间的特征相似度,确定所述目标参照字符相对于所述目标关联文本的字符扩展特征;获取所述目标参照字符相对于所述关联文本集合中其他各个关联文本的字符扩展特征;将所述目标参照字符的编码特征,与所述目标参照字符相对于所述关联文本集合中各个关联文本的字符扩展特征进行特征融合处理,得到所述目标参照字符的字符预测特征;根据所述目标参照字符的字符预测特征,得到所述目标文本的预测特征。4.如权利要求3所述的方法,其特征在于,所述基于所述目标参照字符与所述目标关联文本的各个关联字符之间的特征相似度,确定所述目标参照字符相对于所述目标关联文本的字符扩展特征,包括:分别对所述目标参照字符与所述目标关联文本的各个关联字符之间的特征相似度进行归一化处理,得到所述目标关联文本的各个关联字符相对所述目标参照字符的相似度权
重;采用所述目标关联文本的各个关联字符相对所述目标参照字符的相似度权重,对所述目标关联文本的各个关联字符的编码特征进行加权融合处理,得到所述目标参照字符相对于所述目标关联文本的字符扩展特征。5.如权利要求3所述的方法,其特征在于,所述将所述目标参照字符的编码特征,与所述目标参照字符相对于所述关联文本集合中各个关联文本的字符扩展特征进行特征融合处理,得到所述目标参照字符的字符预测特征,包括:将所述目标参照字符相对于所述关联文本集合中各个关联文本的字符扩展特征进行特征拼接处理,得到所述目标参照字符对应的联合扩展特征;根据所述目标参照字符的编码特征以及所述目标参照字符对应的联合扩展特征,确定所述目标参照字符的字符预测特征。6.如权利要求5所述的方法,其特征在于,所述根据所述目标参照字符的编码特征以及所述目标参照字符对应的联合扩展特征,确定所述目标参照字符的字符预测特征,包括:将所述目标参照字符的编码特征与所述目标参照字符对应的联合扩展特征进行特征拼接处理,得到所述目标参照字符的字符预测特征。7.如权利要求5所述的方法,其特征在于,所述根据所述目标参照字符的编码特征以及所述目标参照字符对应的联合扩展特征,确定所述目标参照字符的字符预测特征,包括:采用预设变换参数对所述目标参照字符对应的联合扩展特征进行特征变换处理,得到所述目标参照字符对应的变换扩展特征;...
【专利技术属性】
技术研发人员:杨韬,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。