【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种文件标注方法,其包括:根据待标注文件,获取待标注文件的特征向量;根据待标注文件的特征向量以及待标注文件的特征向量与待标注文件的标签指示向量的转换关系,获得待标注文件的标签指示向量;根据待标注文件的标签指示向量以及待标注文件的标签指示向量与待标注文件的分类指示向量的转换关系,获得待标注文件的分类指示向量;根据待标注文件的标签指示向量和待标注文件的分类指示向量,标注待标注文件。由于分类指示向量一般具有相当好的规范性,噪音小,因此,本专利技术以标签指示向量和分类指示向量相结合的方式对文件进行标注可以减少用户自定义标注数据存在的噪音对自动标注带来的不良影响,提局自动标注的准确率与命中率。【专利说明】文件标注方法及装置
本专利技术涉及文件分类领域,具体涉及一种文件标注方法及装置。
技术介绍
目前,图像标注可以分为手动标注和自动标注两类。其中,手动标注虽然能够有效 的将图像进行标注,但是效率低。随着互联网中图像文件数量的急剧增长,手动标注已经难 以满足要求,为此自动标注应运而生。 现有图像自动标注方法包括抽取训练 ...
【技术保护点】
一种文件标注方法,其特征在于,包括:获取待标注文件;根据所述待标注文件,获取所述待标注文件的特征向量;根据所述待标注文件的特征向量以及所述待标注文件的特征向量与所述待标注文件的标签指示向量的转换关系,获得所述待标注文件的标签指示向量;根据所述待标注文件的标签指示向量以及所述待标注文件的标签指示向量与所述待标注文件的分类指示向量的转换关系,获得所述待标注文件的分类指示向量;根据所述待标注文件的标签指示向量和所述待标注文件的分类指示向量,标注所述待标注文件。
【技术特征摘要】
【专利技术属性】
技术研发人员:邓志鸿,张杰,赖博彦,
申请(专利权)人:华为技术有限公司,北京大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。