一种视频中文字信息的检测方法、装置及电子设备制造方法及图纸

技术编号:21629239 阅读:62 留言:0更新日期:2019-07-17 11:11
本说明书公开了一种视频中文字信息的检测方法、装置及电子设备。该视频中文字信息的检查方法包括:从待检测视频中提取目标图片,包括待检测视频中的关键帧;从目标图片中提取文字信息,并对所述文字信息进行文本句子分词获得分词后的句子;进一步对分词后的句子进行向量转换,获得句子中分词的词向量;最后将分词后的句子和转换获得的词向量输入文本分类模型,通过文本分类模型进行语义识别并输出表征文字信息中是否包含具有预设语义的文字的语义识别结果,来实现违规视频文字的检测,即通过对视频中关键帧的提取和文字信息的语义识别避免因为简单的文字表达方式的变化而无法检测出违规视频文字,提高违规视频文字检测的准确性及检查效率。

A Method, Device and Electronic Equipment for Detecting Chinese Character Information in Video

【技术实现步骤摘要】
一种视频中文字信息的检测方法、装置及电子设备
本说明书涉及软件
,特别涉及一种视频中文字信息的检测方法、装置及电子设备。
技术介绍
随着网路技术的不断发展,多媒体资源呈爆炸式增长,其中,视频资源的增长尤为迅速,视频质量的监管显得尤为重要。视频质量包括图像内容的监管和视频文字的监管,图像内容的监管主要是对违规图像内容的拦截,已经能够通过图像识别技术很好的进行拦截,但对于视频文字的监管,由于文字的多变性及在视频中出现位置的不确定性,视频文字的违规难以被检测出来,亟需一种视频中文字信息的检测方法,来实现违规视频文字的检测。
技术实现思路
本说明书实施例提供一种视频中文字信息的检测方法、装置及电子设备,用于实现对违规视频文字的检测,提高违规视频文字检测的准确性。第一方面,本说明书实施例提供一种视频中文字信息的检测方法,包括:从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;从所述目标图片中提取文字信息;对所述文字信息进行文本句子分词,获得分词后的句子;对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。第二方面,本说明书实施例提供一种视频中文字信息的检测装置,包括:图片提取单元,用于从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;文字提取单元,用于从所述目标图片中提取文字信息;分词单元,用于对所述文字信息进行文本句子分词,获得分词后的句子;向量转换单元,用于对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;识别单元,用于将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。第三方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;从所述目标图片中提取文字信息;对所述文字信息进行文本句子分词,获得分词后的句子;对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。第四方面,本说明书实施例提供一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;从所述目标图片中提取文字信息;对所述文字信息进行文本句子分词,获得分词后的句子;对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。本说明书实施例中的上述一个或多个技术方案,至少具有如下技术效果:本说明书实施例提供一种视频中文字信息的检测方法,从待检测视频中提取目标图片,该目标图片包括所述待检测视频中的关键帧;从目标图片中提取文字信息;对文字信息进行文本句子分词,获得分词后的句子;对分词后的句子进行向量转换获得句子中的词向量;将分词后的句子和词向量输入文本分类模型,通过文本分类模型进行语义识别并输出表征文字信息中是否包含具有预设语义的文字的语义识别结果,及通过对视频中文字信息的语义识别,来实现违规视频文字的检测,避免因为简单的文字表达方式的变化而无法检测出违规视频文字,提高违规视频文字检测的准确性。进一步的,本说明实施例提供的上述方法,在进行视频中文字信息的检测时,通过提取视频中关键帧,由于关键帧中涵盖明显变化的视频内容,从关键帧中提取文字信息进行识别,能够大大减少视频文字识别的计算量,达到提高违规视频文字检测效率的有益效果。附图说明为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本说明书实施例提供的一种视频中文字信息的检测方法的流程示意图;图2为本说明书实施例提供的一种视频中文字信息的检测装置的示意图;图3为本说明书实施例提供的一种电子设备的示意图。具体实施方式为使本说明书实施例的目的、技术方案和优点更加清楚,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。在本说明书实施例提供一种视频中文字信息的检测方法、装置及电子设备,用于实现对违规视频文字的检测,提高违规视频文字检测的准确性。下面结合附图对本说明书实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。实施例请参考图1,本说明书实施例提供一种视频中文字信息的检测方法,该方法包括:S10:从待检测视频中提取目标图片,所述目标图片包括所述待检测视频中的关键帧;S12:从所述目标图片中提取文字信息;S14:对所述文字信息进行文本句子分词,获得分词后的句子;S16:对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;S18:将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。具体实施过程中,执行S10从待检测视频中提取目标图片,该目标图片为视频中的部分图片,用于提高视频中违规文字的检测效率。其中,目标图片可以包含待检测视频中的关键帧,以及待检测视频中的热点帧和/或随机帧。一个视频由十几张至上千张图片组成,视频中的图片又被称为帧,视频中角色或者物体运动或变化中的关键动作所处的那一帧被称为关键帧,或者视频中一个定义任何的起点和终点平滑过渡的帧为关键帧,一系列关键帧定义了观看者将看到的运动过程。相对于视频中的普通帧,关键帧包含的变化信息量较大,通过关键帧能够快速、有效的获取视频中的关键信息,提取关键帧来进行视频违规文字的检测能够有效减少视频检测中的重复计算,又能够避免遗漏关键信息,有效提高视频违规文字检测的效率和准确率。具体的,可以根据待检测视频中每帧图片之间的相似度,提取待检测视频中的关键帧作为目标图片。例如,可以计算待检测视频中一段时长内的帧与帧之间的平均相似度;然后,找出该段时长内与前一帧的相似度小于平均值的预设倍数的帧;如果没有这样的帧,可以提取该段时长内的中间帧作为关键帧;如果存在这样的帧,则可以提取该段时长内与前一帧的相似度小本文档来自技高网...

【技术保护点】
1.一种视频中文字信息的检测方法,包括:从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;从所述目标图片中提取文字信息;对所述文字信息进行文本句子分词,获得分词后的句子;对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。

【技术特征摘要】
1.一种视频中文字信息的检测方法,包括:从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;从所述目标图片中提取文字信息;对所述文字信息进行文本句子分词,获得分词后的句子;对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。2.如权利要求1所述的方法,从待检测视频中提取目标图片,包括:从所述待检测视频中提取评论量大于设定阈值的热点帧,将所述热点帧作为所述目标图片;和/或,从所述待检测视频中随机提取预设数量的随机帧,将所述随机帧作为所述目标图片。3.如权利要求2所述的方法,所述对所述分词后的句子进行向量转换,获得所述句子中分词的词向量,包括:通过中文词向量算法或者自然语言向量转换算法,对所述分词后的句子进行向量转换,获得所述句子中分词的词向量。4.如权利要求1~3任一所述的方法,所述文本分类模型为基于卷积神经网络训练获得的文本分类模型。5.一种视频中文字信息的检测装置,包括:图片提取单元,用于从待检测视频中提取目标图片,其中,所述目标图片包括所述待检测视频中的关键帧;文字提取单元,用于从所述目标图片中提取文字信息;分词单元,用于对所述文字信息进行文本句子分词,获得分词后的句子;向量转换单元,用于对所述分词后的句子进行向量转换,获得所述句子中分词的词向量;识别单元,用于将所述分词后的句子和所述词向量输入文本分类模型,通过所述文本分类模型进行语义识别并输出语义识别结果,所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。6.如权利要求5所述的装置,所述图片提取单...

【专利技术属性】
技术研发人员:曹绍升孙晓军周俊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1