内容识别方法、装置、介质及电子设备制造方法及图纸

技术编号：32031417 阅读：14 留言：0更新日期：2022-01-27 13:04

本公开涉及一种内容识别方法、装置、介质及电子设备，所述方法包括：接收待识别内容；根据包含所述待识别内容的多个内容识别对和内容识别模型，获得所述多个内容识别对的识别结果，其中，每一所述内容识别对还包括预设集合中的一个候选内容，所述内容识别模型用于获取所述待识别内容和所述候选内容在多个维度下的维度特征，并基于所述多个维度特征确定所述识别结果，所述多个维度用于表示所述待识别内容中的多种类型的组成部分；根据多个所述识别结果，确定所述待识别内容的目标识别结果。由此，可以实现不同维度的特征之间的识别，提高识别结果的准确性，节省人工工作量，便于用户使用。使用。使用。

全部详细技术资料下载

【技术实现步骤摘要】
内容识别方法、装置、介质及电子设备

[0001]本公开涉及计算机
，具体地，涉及一种内容识别方法、装置、介质及电子设备。

技术介绍

[0002]计算机技术的发展，使新闻、资讯等内容越来越多地被关注，同时内容共享平台的兴起使得可以发布内容的用户更加多样。平台通常会承载很多的UGC(User
‑
generated content，用户生成内容)和PGC(Professional
‑
generated content，专业生成内容)，而为了保证内容的有效性，通常需要工作人员对发布的内容进行审核，以确定待发布的内容是否是抄袭已发布的其他内容。
[0003]然而在上述过程中需要耗费大量人力的同时，极有可能因为人工主观的理解不同造成误判或者漏判的情况，并且更难以应对大量的内容的审核过程。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种内容识别方法，所述方法包括：
[0006]接收待识别内容；
[0007]根据包含所述待识别内容的多个内容识别对和内容识别模型，获得所述多个内容识别对的识别结果，其中，每一所述内容识别对还包括预设集合中的一个候选内容，所述内容识别模型用于获取所述待识别内容和所述候选内容在多个维度下的维度特...

【技术保护点】

【技术特征摘要】
1.一种内容识别方法，其特征在于，所述方法包括：接收待识别内容；根据包含所述待识别内容的多个内容识别对和内容识别模型，获得所述多个内容识别对的识别结果，其中，每一所述内容识别对还包括预设集合中的一个候选内容，所述内容识别模型用于获取所述待识别内容和所述候选内容在多个维度下的维度特征，并基于所述多个维度特征确定所述识别结果，所述多个维度用于表示所述待识别内容中的多种类型的组成部分；根据多个所述识别结果，确定所述待识别内容的目标识别结果。2.根据权利要求1所述的方法，其特征在于，所述维度与所述内容识别模型的特征提取子模型一一对应，所述根据包含所述待识别内容的多个内容识别对和内容识别模型，获得所述多个内容识别对的识别结果，包括：针对每一所述内容识别对，根据所述待识别内容和该内容识别对中的候选内容，以及每一维度对应的所述特征提取子模型，确定所述待识别内容和所述候选内容分别在多个维度下对应的维度特征；针对每一所述维度，将所述待识别内容和所述候选内容在该维度下的特征进行拼接，获得该维度对应的拼接特征；根据多个维度对应的拼接特征，获得所述内容识别对对应的融合特征；基于所述内容识别模型的分类子模型和所述融合特征，确定所述内容识别对的识别结果。3.根据权利要求2所述的方法，其特征在于，所述根据多个维度对应的拼接特征，获得所述内容识别对对应的融合特征，包括：针对每一维度对应的拼接特征，基于第一注意力层对所述拼接特征进行处理，获得所述拼接特征对应的注意力特征；将每一维度下的注意力特征进行拼接，获得多维度拼接特征；基于第二注意力层对所述多维度拼接特征进行处理，获得所述融合特征。4.根据权利要求2所述的方法，其特征在于，所述识别结果包括所述待识别内容对应于分类的识别参数，所述基于所述内容识别模型的分类子模型和所述融合特征，确定所述内容识别对的识别结果，包括：根据所述融合特征和所述分类子模型，获得所述融合特征分别对应于多个分类的特征向量，所述分类包括相似内容分类、低质量内容分类、原创内容分类；对所述特征向量进行处理，获得所述融合特征对应于每一分类的识别参数，以获得所述识别结果。5.根据权利要求1所述的方法，其特征在于，所述识别结果包括所述待识别内容对应于分类的识别参数，所述根据多个所述识别结果，确定所述待识别内容的目标识别结果，包括：获取多个识别结果中分别对应于相似内容分类的识别参数；若多个所述相似内容分类的识别参数满足相似识别条件，确定所述目标识别结果为相似内容分类，其中，所述相似识别条件包括：所述对应于相似内容分类的识别参数的最大值大于第一预设阈值；
所述对应于相似内容分类的识别参数的最大值小于或等于所述第一预设阈值，且所述对应于相似内容分类的识别参数的平均值大于第二预设阈值。6.根据权利要求5所述的方法，其特征在于，所述根据多个所述识别结果，确定所述待识别内容的目标识别结果，还包括：获取多个识别结果中分别对应于低质量内容分类的识别参数；若多个所述低质量内容分类的识别参数满足低质量识别条件，且多个所述相似内容分类的识别参数不满足相似识别条件，确定所述目标识别结果为低质量内容分类，其中，所...

【专利技术属性】
技术研发人员：陈维识，洪进栋，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人