标签的处理方法及装置制造方法及图纸

技术编号：15267529 阅读：126 留言：0更新日期：2017-05-04 02:12

本发明专利技术提供一种标签的处理方法及装置。本发明专利技术实施例通过获取资源的语义特征数据，进而根据所述资源的语义特征数据，获得所述资源的至少一个标签序列的后验概率，使得能够根据所述后验概率，选择一个标签序列，以作为所述资源的标签集合，从而实现了获得资源的多个标签的目的。

Label processing method and device

The invention provides a method and a device for processing label. The embodiment of the invention, the semantic features of the data access to resources, and then according to the semantic features of the data resources, at least one tag sequence to obtain the resources of the posterior probability, which can according to the posterior probability, select a tag sequence, as the source of the tag set, so as to realize the a number of resources to obtain the label.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及标签处理技术，尤其涉及一种标签的处理方法及装置。
技术介绍
社会标签(Socialtagging)简称为标签，是一种更为灵活、有趣的分类方式，它允许用户自由地标注各种资源，例如网页、学术论文和多媒体等资源。社会标签可以帮助用户分类整理和查询各类信息，广泛应用于社会标签网站(例如，Flickr、Picassa、YouTube、Plaxo等)、博客(例如，Blogger、WordPress、LiveJournal等)、百科(例如，Wikipedia、PBWiki等)、微博(例如，Twitter、Jaiku等)等系统。现有技术中，提供了对资源进行单一标签分类的方法，以生成资源的一个标签。然而，由于客观事物本身的复杂性，一个资源可能同时具有多个不同的标签，如何对资源进行多标签分类，以生成资源的多个标签，已经成为目前的一个研究热点。
技术实现思路
本专利技术的多个方面提供一种标签的处理方法及装置，用以获得资源的多个标签。本专利技术的一方面，提供一种标签的处理方法，包括：获取资源的语义特征数据；根据所述资源的语义特征数据，获得所述资源的至少一个标签序列的后验概率；根据所述后验概率，选择一个标签序列，以作为所述资源的标签集合。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述获取资源的语义特征数据，包括：利用预先构建的卷积神经网络，对所述资源进行处理，以获得所述资源的语义特征数据。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述方法还包括：根据标签在第一训练样本集中的出现情况，对所述第一训练样本集中每...
标签的处理方法及装置

【技术保护点】
一种标签的处理方法，其特征在于，包括：获取资源的语义特征数据；根据所述资源的语义特征数据，获得所述资源的至少一个标签序列的后验概率；根据所述后验概率，选择一个标签序列，以作为所述资源的标签集合。

【技术特征摘要】
1.一种标签的处理方法，其特征在于，包括：获取资源的语义特征数据；根据所述资源的语义特征数据，获得所述资源的至少一个标签序列的后验概率；根据所述后验概率，选择一个标签序列，以作为所述资源的标签集合。2.根据权利要求1所述的方法，其特征在于，所述获取资源的语义特征数据，包括：利用预先构建的卷积神经网络，对所述资源进行处理，以获得所述资源的语义特征数据。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：根据标签在第一训练样本集中的出现情况，对所述第一训练样本集中每个第一训练样本中所包含的至少一个标签进行排序处理，以获得所述第一每个训练样本的样本序列；根据所述第一每个训练样本的样本序列，构建所述卷积神经网络。4.根据权利要求1所述的方法，其特征在于，所述根据所述资源的语义特征数据，获得所述资源的至少一个标签序列的后验概率，包括：根据所述资源的语义特征数据，利用预先构建的递归神经网络，获得所述资源的至少一个标签序列的后验概率。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：根据标签在第二训练样本集中的出现情况，对所述第二训练样本集中每个第二训练样本中所包含的至少一个标签进行排序处理，以获得所述每个第二训练样本的样本序列；获取所述第二训练样本集中每个第二训练样本中所包含的一个资源的语义特征数据；根据所述每个第二训练样本的样本序列和所述每个第二训练样本中所包
\t含的一个资源的语义特征数据，构建所述递归神经网络。6.根据权利要求1所述的方法，其特征在于，所述根据所述后验概率，选择一个标签序列，包括：根据所述后验概率，从所述资源的全部标签序列中，选择所述一个标签序列；或者根据所述后验概率，从所述资源的部分标签序列中，选择所述一个标签序列。7.根据权利要求1～6任一权利要求所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：王江，黄畅，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人