文本内容的识别方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:37885248 阅读:8 留言:0更新日期:2023-06-18 11:50
本申请公开了一种文本内容的识别方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:获取目标文本以及目标视频类型,目标文本是与目标视频相关联的文本,目标视频类型是目标视频的视频类型;对目标文本进行语义特征提取,得到目标文本的文本语义特征;对目标视频类型进行类型特征提取,得到目标视频的视频类型特征;基于文本语义特征与视频类型特征对目标文本进行文本内容识别,得到文本内容识别结果,文本识别结果用于指示目标文本对于目标视频与特定类型文本的关系。采用本申请提供的方法,在进行文本内容识别时引入视频类型特征,可针对不同视频类型进行特定类型文本的识别,可提高文本识别的准确性。可提高文本识别的准确性。可提高文本识别的准确性。

【技术实现步骤摘要】
文本内容的识别方法、装置、设备、存储介质及程序产品


[0001]本申请实施例涉及人工智能领域,特别涉及一种文本内容的识别方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]目前,许多视频播放平台支持用户对视频发表评论的功能,如,发送弹幕功能。视频的评论内容需对文本进行过滤。
[0003]相关技术中,对视频相关联的文本进行文本内容识别时,直接提取文本的语义特征,从而基于文本语义特征识别是否为例如违规文本。然而,对于同一评论内容在不同场景下可能对应含义不同,若仅基于评论内容的文本语义特征进行识别,容易造成误识别的情况,即识别文本是否为违规文本的准确性较低。

技术实现思路

[0004]本申请实施例提供了一种文本内容的识别方法、装置、设备、存储介质及程序产品,可降低对视频关联文本误识别的概率,提高文本内容识别的准确性。
[0005]所述技术方案如下:
[0006]一方面,本申请实施例提供了一种文本内容的识别方法,所述方法包括:
[0007]获取目标文本以及目标视频类型,所述目标文本是与目标视频相关联的文本,所述目标视频类型是所述目标视频的视频类型;
[0008]对所述目标文本进行语义特征提取,得到所述目标文本的文本语义特征;
[0009]对所述目标视频类型进行类型特征提取,得到所述目标视频的视频类型特征;
[0010]基于所述文本语义特征与所述视频类型特征对所述目标文本进行文本内容识别,得到文本内容识别结果,所述文本内容识别结果用于指示所述目标文本对于所述目标视频与特定类型文本的关系。
[0011]另一方面,本申请实施例提供了一种文本内容的识别装置,所述装置包括:
[0012]获取模块,用于获取目标文本以及目标视频类型,所述目标文本是与目标视频相关联的文本,所述目标视频类型是所述目标视频的视频类型;
[0013]第一特征提取模块,用于对所述目标文本进行语义特征提取,得到所述目标文本的文本语义特征;
[0014]第二特征提取模块,用于对所述目标视频类型进行类型特征提取,得到所述目标视频的视频类型特征;
[0015]第一识别模块,用于基于所述文本语义特征与所述视频类型特征,对所述目标文本进行文本内容识别,得到文本内容识别结果,所述文本内容识别结果用于指示所述目标文本对于所述目标视频与特定类型文本的关系。
[0016]另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一
条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的文本内容的识别方法。
[0017]另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的文本内容的识别方法。
[0018]另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面提供的文本内容的识别方法。
[0019]本申请实施例提供的技术方案带来的有益效果至少包括:
[0020]本申请实施例中,当对与目标视频的相关联的文本进行文本内容识别时,计算机设备首先提取文本的文本语义特征,并获取目标视频的视频类型,对视频类型进行特征提取得到视频类型特征,进而基于文本语义特征与视频类型特征识别目标文本与特定类型文本的关系。即本申请实施例中,在进行文本内容识别时引入视频类型特征,可针对不同视频类型进行特定文本类型的识别,相较于相关技术中仅基于文本语义特征进行文本内容识别的方案,可降低对视频关联文本误识别的概率,提高文本内容识别的准确性。
附图说明
[0021]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1示出了本申请实施例提供的文本内容的识别方法的原理示意图;
[0023]图2示出了本申请一个示例性实施例提供的实施环境的示意图;
[0024]图3示出了本申请一个示例性实施例提供的文本内容的识别方法的流程图;
[0025]图4示出了本申请另一个示例性实施例提供的文本内容的识别方法的流程图;
[0026]图5示出了本申请一个示例性实施例提供的文本内容识别过程的实施示意图;
[0027]图6示出了本申请一个示例性实施例提供的分类网络训练方法的流程图;
[0028]图7是本申请一个示例性实施例提供的文本内容的识别装置的结构框图;
[0029]图8示出了本申请一个示例性实施例提供的计算机设备的结构示意图。
具体实施方式
[0030]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0031]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0032]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0033]自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。本申请实施例提供的文本内容的识别方法即在语义理解方面的应用,通过在文本内容识别过程中引入视频类型特征,从而提高文本内容识别的准确性。
[0034]相关技术中,在对视频相关联的文本比如弹幕进行文本内容识别时,确定文本是否为特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本内容的识别方法,其特征在于,所述方法包括:获取目标文本以及目标视频类型,所述目标文本是与目标视频相关联的文本,所述目标视频类型是所述目标视频的视频类型;对所述目标文本进行语义特征提取,得到所述目标文本的文本语义特征;对所述目标视频类型进行类型特征提取,得到所述目标视频的视频类型特征;基于所述文本语义特征与所述视频类型特征,对所述目标文本进行文本内容识别,得到文本内容识别结果,所述文本内容识别结果用于指示所述目标文本对于所述目标视频与特定类型文本的关系。2.根据权利要求1所述的方法,其特征在于,所述基于所述文本语义特征与所述视频类型特征,对所述目标文本进行文本内容识别,得到文本内容识别结果,包括:基于所述文本语义特征与所述视频类型特征,得到语义融合特征,所述语义融合特征用于指示所述目标文本为所述目标视频类型对应视频的关联文本时所述目标文本的含义;基于所述语义融合特征与所述视频类型特征,对所述目标文本进行所述文本内容识别,得到所述文本内容识别结果。3.根据权利要求2所述的方法,其特征在于,所述基于所述文本语义特征与所述视频类型特征,得到语义融合特征,包括:基于所述文本语义特征与所述视频类型特征,确定相关系数,所述相关系数用于指示所述目标文本与所述目标视频类型的相关性;基于所述相关系数,对所述文本语义特征进行加权得到所述语义融合特征。4.根据权利要求3所述的方法,其特征在于,所述基于所述文本语义特征与所述视频类型特征,确定相关系数,包括:通过第一全连接层对所述文本语义特征进行全连接处理,得到文本语义特征向量;通过第二全连接层对所述视频类型特征进行所述全连接处理,得到视频类型特征向量,所述视频类型特征向量与所述文本语义特征向量的向量维度相同;将所述文本语义特征向量与所述视频类型特征向量相乘,得到所述相关系数。5.根据权利要求2所述的方法,其特征在于,所述基于所述语义融合特征与所述视频类型特征,对所述目标文本进行所述文本内容识别,得到所述文本内容识别结果,包括:将所述语义融合特征与所述视频类型特征进行特征拼接,得到目标文本特征;将所述目标文本特征输入分类器,得到所述目标文本属于所述特定类型文本的概率,所述分类器包括第三全连接层以及Softmax层。6.根据权利要求1至5任一所述的方法,其特征在于,所述对所述目标视频类型进行类型特征提取,得到所述目标视频的视频类型特征,包括:对所述目标视频类型进行特征编码,得到所述目标视频的视频类型特征。7.根据权利要求1至5任一所述的方法,其特征在于,所述基于所述文本语义特征与所述视频类型特征,对所述目标文本进行文本内容识别,得到文本内容识别结果,包括:将所述文本语义特征与所述视频类型特征输入分类网络,得到所述文本内容识别结果,所述分类网络基于样本文本、样本视频类型以及样本文本标签训练得到,所述样本文本是与样本视频相关联的文本,所述样本视频类型是所述样本视频的视频类型,所述样本文本标签用于指示所述样本文本与所述特定...

【专利技术属性】
技术研发人员:李振阳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1