【技术实现步骤摘要】
【技术保护点】
一种版权资源识别方法,其特征在于,包括:S1、利用已有的版权资源的标题进行搜索获取正样本语料,并利用非版权资源的标题进行搜索获取负样本语料;S2、提取正样本语料的特征作为版权资源对应的分类特征,提取负样本语料的特征作为非版权资源对应的分类特征,并计算各分类特征在所属类别中的权值,构成分类模型;S3、获取待识别资源,对所述待识别资源执行步骤S31至步骤S33:S31、利用所述待识别资源的标题进行搜索,获得待预测语料;S32、提取待预测语料的分类特征,利用所述分类模型确定所述待识别资源属于版权资源或非版权资源的置信度;S33、根据所述待识别资源属于版权资源或者非版权资源的置信度,识别所述待识别资源是否为版权资源。
【技术特征摘要】
【专利技术属性】
技术研发人员:徐兴军,吴羡,刘婵,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。