文本内容的识别方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：37885248 阅读：8 留言：0更新日期：2023-06-18 11:50

本申请公开了一种文本内容的识别方法、装置、设备、存储介质及程序产品，涉及人工智能领域。该方法包括：获取目标文本以及目标视频类型，目标文本是与目标视频相关联的文本，目标视频类型是目标视频的视频类型；对目标文本进行语义特征提取，得到目标文本的文本语义特征；对目标视频类型进行类型特征提取，得到目标视频的视频类型特征；基于文本语义特征与视频类型特征对目标文本进行文本内容识别，得到文本内容识别结果，文本识别结果用于指示目标文本对于目标视频与特定类型文本的关系。采用本申请提供的方法，在进行文本内容识别时引入视频类型特征，可针对不同视频类型进行特定类型文本的识别，可提高文本识别的准确性。可提高文本识别的准确性。可提高文本识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本内容的识别方法、装置、设备、存储介质及程序产品

[0001]本申请实施例涉及人工智能领域，特别涉及一种文本内容的识别方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]目前，许多视频播放平台支持用户对视频发表评论的功能，如，发送弹幕功能。视频的评论内容需对文本进行过滤。
[0003]相关技术中，对视频相关联的文本进行文本内容识别时，直接提取文本的语义特征，从而基于文本语义特征识别是否为例如违规文本。然而，对于同一评论内容在不同场景下可能对应含义不同，若仅基于评论内容的文本语义特征进行识别，容易造成误识别的情况，即识别文本是否为违规文本的准确性较低。

技术实现思路

[0004]本申请实施例提供了一种文本内容的识别方法、装置、设备、存储介质及程序产品，可降低对视频关联文本误识别的概率，提高文本内容识别的准确性。
[0005]所述技术方案如下：
[0006]一方面，本申请实施例提供了一种文本内容的识别方法，所述方法包括：
[0007]获取目标文本以及目标视频类型，所述目标文本是与目标视频相关联的文本，所述目标视频类型是所述目标视频的视频类型；
[0008]对所述目标文本进行语义特征提取，得到所述目标文本的文本语义特征；
[0009]对所述目标视频类型进行类型特征提取，得到所述目标视频的视频类型特征；
[0010]基于所述文本语义特征与所述视频类型特征对所述目标文本进行文本内容识别，得到文本内容识别结果，所述文本内容识别结果用于指示所述目标...

【技术保护点】

【技术特征摘要】
1.一种文本内容的识别方法，其特征在于，所述方法包括：获取目标文本以及目标视频类型，所述目标文本是与目标视频相关联的文本，所述目标视频类型是所述目标视频的视频类型；对所述目标文本进行语义特征提取，得到所述目标文本的文本语义特征；对所述目标视频类型进行类型特征提取，得到所述目标视频的视频类型特征；基于所述文本语义特征与所述视频类型特征，对所述目标文本进行文本内容识别，得到文本内容识别结果，所述文本内容识别结果用于指示所述目标文本对于所述目标视频与特定类型文本的关系。2.根据权利要求1所述的方法，其特征在于，所述基于所述文本语义特征与所述视频类型特征，对所述目标文本进行文本内容识别，得到文本内容识别结果，包括：基于所述文本语义特征与所述视频类型特征，得到语义融合特征，所述语义融合特征用于指示所述目标文本为所述目标视频类型对应视频的关联文本时所述目标文本的含义；基于所述语义融合特征与所述视频类型特征，对所述目标文本进行所述文本内容识别，得到所述文本内容识别结果。3.根据权利要求2所述的方法，其特征在于，所述基于所述文本语义特征与所述视频类型特征，得到语义融合特征，包括：基于所述文本语义特征与所述视频类型特征，确定相关系数，所述相关系数用于指示所述目标文本与所述目标视频类型的相关性；基于所述相关系数，对所述文本语义特征进行加权得到所述语义融合特征。4.根据权利要求3所述的方法，其特征在于，所述基于所述文本语义特征与所述视频类型特征，确定相关系数，包括：通过第一全连接层对所述文本语义特征进行全连接处理，得到文本语义特征向量；通过第二全连接层对所述视频类型特征进行所述全连接处理，得到视频类型特征向量，所述视频类型特征向量与所述文本语义特征向量的向量维度相同；将所述文本语义特征向量与所述视频类型特征向量相乘，得到所述相关系数。5.根据权利要求2所述的方法，其特征在于，所述基于所述语义融合特征与所述视频类型特征，对所述目标文本进行所述文本内容识别，得到所述文本内容识别结果，包括：将所述语义融合特征与所述视频类型特征进行特征拼接，得到目标文本特征；将所述目标文本特征输入分类器，得到所述目标文本属于所述特定类型文本的概率，所述分类器包括第三全连接层以及Softmax层。6.根据权利要求1至5任一所述的方法，其特征在于，所述对所述目标视频类型进行类型特征提取，得到所述目标视频的视频类型特征，包括：对所述目标视频类型进行特征编码，得到所述目标视频的视频类型特征。7.根据权利要求1至5任一所述的方法，其特征在于，所述基于所述文本语义特征与所述视频类型特征，对所述目标文本进行文本内容识别，得到文本内容识别结果，包括：将所述文本语义特征与所述视频类型特征输入分类网络，得到所述文本内容识别结果，所述分类网络基于样本文本、样本视频类型以及样本文本标签训练得到，所述样本文本是与样本视频相关联的文本，所述样本视频类型是所述样本视频的视频类型，所述样本文本标签用于指示所述样本文本与所述特定...

【专利技术属性】
技术研发人员：李振阳，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人