【技术实现步骤摘要】
媒体资源的识别方法、装置、存储介质及电子装置
本专利技术涉及计算机领域,具体而言,涉及一种媒体资源的识别方法、装置、存储介质及电子装置。
技术介绍
随着互联网的发展,人们发表、获取媒体资源的方式更加多元化。例如,人们可以通过新闻网站、新闻客户端、或者其他包含自媒体的客户端中查看媒体资源。随着媒体资源数量的增多,大量的媒体信息出现在日常生活的各个角落,媒体资源内容的审核更加重要。传统的人工审核方式是基于媒体资源的内容进行审核,通常会忽略到查阅者的感受,无法满足查阅者的需求。此外,人工审核的方式效率低,需要浪费大量的人力。针对相关技术中,现有技术中的媒体资源审核方式效率低,无法满足查阅者需求的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种媒体资源的识别方法、装置、存储介质及电子装置,以至少解决现有技术中的媒体资源审核方式效率低,无法满足查阅者需求的技术问题。根据本专利技术实施例的一个方面,提供了一种媒体资源的识别方法,包括:获取多个帐号对待识别的目标媒体资 ...
【技术保护点】
1.一种媒体资源的识别方法,其特征在于,包括:/n获取多个帐号对待识别的目标媒体资源产生的第一组回复信息,其中,所述第一组回复信息中的回复信息用于表示所述目标媒体资源属于异常类型的媒体资源;/n将所述第一组回复信息输入到第一识别模型,得到所述第一识别模型输出的所述目标媒体资源在所述异常类型下的一组维度标签,其中,所述第一识别模型中包括多个不同类型的第二识别模型,每个所述第二识别模型是使用一组训练数据对对应类型的初始识别模型训练得到的识别模型,所述一组训练数据包括对已知维度标签的样本媒体资源产生的一组样本回复信息,所述一组样本回复信息用于表示所述样本媒体资源属于所述异常类型的 ...
【技术特征摘要】
1.一种媒体资源的识别方法,其特征在于,包括:
获取多个帐号对待识别的目标媒体资源产生的第一组回复信息,其中,所述第一组回复信息中的回复信息用于表示所述目标媒体资源属于异常类型的媒体资源;
将所述第一组回复信息输入到第一识别模型,得到所述第一识别模型输出的所述目标媒体资源在所述异常类型下的一组维度标签,其中,所述第一识别模型中包括多个不同类型的第二识别模型,每个所述第二识别模型是使用一组训练数据对对应类型的初始识别模型训练得到的识别模型,所述一组训练数据包括对已知维度标签的样本媒体资源产生的一组样本回复信息,所述一组样本回复信息用于表示所述样本媒体资源属于所述异常类型的媒体资源,所述已知维度标签为所述样本媒体资源在所述异常类型下的维度标签,每个所述第二识别模型输出的所述样本媒体资源在所述异常类型下的预估维度标签与所述已知维度标签之间的误差满足预定收敛条件;
其中,对于所述第一组回复信息中的每条回复信息,在所述多个不同类型的第二识别模型输出的维度标签不完全相同的情况下,将所述多个不同类型的第二识别模型输出的相同数量最多的维度标签确定为所述第一识别模型输出的所述目标媒体资源在所述异常类型下的维度标签。
2.根据权利要求1所述的方法,其特征在于,在将所述第一组回复信息输入到第一识别模型,得到所述第一识别模型输出的所述目标媒体资源在所述异常类型下的一组维度标签之后,所述方法还包括:
在所述一组维度标签中确定出现次数最高或出现次数高于预定阈值的目标维度标签;
将所述目标媒体资源的类型确定为所述异常类型、且将所述目标媒体资源在所述异常类型下的维度标签确定为包括所述目标维度标签。
3.根据权利要求1所述的方法,其特征在于,在将所述第一组回复信息输入到第一识别模型,得到所述第一识别模型输出的所述目标媒体资源在所述异常类型下的一组维度标签之前,所述方法还包括:
使用所述一组训练数据分别对多个不同类型的初始识别模型进行训练,得到所述多个不同类型的第二识别模型,其中,所述多个不同类型的初始识别模型与所述多个不同类型的第二识别模一一对应。
4.根据权利要求3所述的方法,其特征在于,所述一组训练数据中包括预设训练数据和预设测试数据,其中,所述使用所述一组训练数据分别对多个不同类型的初始识别模型进行训练,得到所述多个不同类型的第二识别模型,包括:
使用所述预设训练数据分别对所述多个不同类型的初始识别模型进行训练,得到多个不同类型的第二预设识别模型,其中,所述多个不同类型的初始识别模型与所述多个不同类型的第二预设识别模型一一对应,所述预设训练数据包括所述一组样本回复信息中的第一组样本回复信息,每个所述第二预设识别模型输出的所述样本媒体资源在所述异常类型下的预估维度标签与所述已知维度标签之间的误差满足预定收敛条件;
使用所述预设测试数据对所述多个不同类型的第二预设识别模型进行测试,在所述多个不同类型的第二预设识别模型中的第三预设识别模型与所述多个不同类型的第二预设识别模型中除所述第三预设识别模型之外的其它预设识别模型的输出结果不一致的情况下,使用所述预设训练数据和所述预设测试数据对所述第三预设识别模型进行重新训练,得到第四预设识别模型,其中,对于相同的输入,所述第四预设识别模型的输出结果与所述其它预设识别模型的输出结果一致,所述预设测试数据包括所述一组样本回复信息中的第二组样本回复信息;
将所述多个不同类型的第二识别模型确定为包括所述其它预设识别模型和所述第四预设识别模型。
5.根据权利要求3所述的方法,其特征在于,所述使用所述一组训练数据分别对多个不同类型的初始识别模型进行训练,得到所述多个不同类型的第二识别模型,包括:
在所述一组训练数据中存在包括第一字符的第一词语的情况下,将所述第一词语中的所述第一字符替换为第二字符,得到包括第二词语的目标训练数据,其中,所述第一字符是所述第一词语中的错别字,所述第二词语是将所述第一词语中...
【专利技术属性】
技术研发人员:蔡慧慧,曹霖,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。