The embodiment of the invention provides a method and apparatus for processing objects, relates to the field of communication, among them, the method comprises: acquiring the annotation vector object; according to whether the similarity judgment of the seed object vector and vector label using the label; if it is determined by the label, through the label mark the object to be marked. The embodiment of the invention, the seed object under the label (typical representative) vector (i.e. seed object vector) vector to replace the label itself, calculation and annotation object similarity vector, thus eliminating the process of vector structure on the label, so as to effectively avoid human the problems caused by the structural vector label.
【技术实现步骤摘要】
对象处理方法及装置
本专利技术涉及通信领域,更为具体而言,涉及对象处理方法及装置。
技术介绍
对象(例如,菜品)的标签是人工定义的有限集合,例如,【川菜】、【祛寒】等。利用标签标注对象的技术是基于对象与标签之间的相似性来确定是否采用该标签来标注所述对象。其中的关键技术是向量的相似度计算,即基于对象的向量与标签的向量之间的相似度来确定对象与标签之间的相似性。然而,在现有技术当中,标签的向量通常需要人为构造,具体而言,需要人为地给标签确定若干个关键词,并给每个关键词人为地赋予权重weight_i,利用这些权重构造出标签tag_i的向量vector_i=[weight_1,weight_2,weight_3,……weight_n],然而,这种人为构造标签向量的方法受人为主观因素的影响,导致其结果不稳定。
技术实现思路
为解决上述技术问题,本专利技术提供了对象处理方法及装置。一方面,本专利技术的实施方式提供了一种对象处理方法,所述方法包括:获取待标注对象的向量;根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签;若判定为采用所述标签,则通过所述标签标注所述待标注对象。在本专利技术的实施方式中,利用标签下的种子对象(具有代表性的典型对象)的向量(即种子对象向量)来取代标签自身的向量,与待标注对象的向量进行相似度计算,省去了对标签进行向量构造的过程,从而有效避免了上述人为构造标签向量所带来的问题。在本专利技术的一些实施方式中,所述根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签包括:根据所述相似度计算所述标签的相似性得分;确定所述相似性得分的排序位次 ...
【技术保护点】
一种对象处理方法,其特征在于,所述方法包括:获取待标注对象的向量;根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签;若判定为采用所述标签,则通过所述标签标注所述待标注对象。
【技术特征摘要】
1.一种对象处理方法,其特征在于,所述方法包括:获取待标注对象的向量;根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签;若判定为采用所述标签,则通过所述标签标注所述待标注对象。2.如权利要求1所述的方法,其特征在于,所述根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签包括:根据所述相似度计算所述标签的相似性得分;确定所述相似性得分的排序位次;识别所述排序位次是否落入设定范围;若所述排序位次落入设定范围,则判定为采用所述标签。3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:构建训练语料,所述训练语料用于获取所述待标注对象的向量。4.如权利要求3所述的方法,其特征在于,所述方法还包括:对所述训练语料执行降噪处理。5.如权利要求4所述的方法,其特征在于,所述对所述训练语料执行降噪处理包括:对所述训练语料中的对象表征文本执行清洗处理;识别清洗后的对象表征文本是否为噪声数据;若所述清洗后的对象表征文本为噪声数据,则将所述清洗后的对象表征文本从所述训练语料中去除。6.一种对象处理装置,其特征在于,所述装置包括:获取模块,用于...
【专利技术属性】
技术研发人员:张岱,闫奎名,佟娜,肜博辉,
申请(专利权)人:北京小度信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。