一种视频中文字信息的检测方法、装置及电子设备制造方法及图纸

技术编号：21629239 阅读：62 留言：0更新日期：2019-07-17 11:11

本说明书公开了一种视频中文字信息的检测方法、装置及电子设备。该视频中文字信息的检查方法包括：从待检测视频中提取目标图片，包括待检测视频中的关键帧；从目标图片中提取文字信息，并对所述文字信息进行文本句子分词获得分词后的句子；进一步对分词后的句子进行向量转换，获得句子中分词的词向量；最后将分词后的句子和转换获得的词向量输入文本分类模型，通过文本分类模型进行语义识别并输出表征文字信息中是否包含具有预设语义的文字的语义识别结果，来实现违规视频文字的检测，即通过对视频中关键帧的提取和文字信息的语义识别避免因为简单的文字表达方式的变化而无法检测出违规视频文字，提高违规视频文字检测的准确性及检查效率。

A Method, Device and Electronic Equipment for Detecting Chinese Character Information in Video

全部详细技术资料下载

【技术实现步骤摘要】
一种视频中文字信息的检测方法、装置及电子设备
本说明书涉及软件
，特别涉及一种视频中文字信息的检测方法、装置及电子设备。
技术介绍
随着网路技术的不断发展，多媒体资源呈爆炸式增长，其中，视频资源的增长尤为迅速，视频质量的监管显得尤为重要。视频质量包括图像内容的监管和视频文字的监管，图像内容的监管主要是对违规图像内容的拦截，已经能够通过图像识别技术很好的进行拦截，但对于视频文字的监管，由于文字的多变性及在视频中出现位置的不确定性，视频文字的违规难以被检测出来，亟需一种视频中文字信息的检测方法，来实现违规视频文字的检测。
技术实现思路
本说明书实施例提供一种视频中文字信息的检测方法、装置及电子设备，用于实现对违规视频文字的检测，提高违规视频文字检测的准确性。第一方面，本说明书实施例提供一种视频中文字信息的检测方法，包括：从待检测视频中提取目标图片，其中，所述目标图片包括所述待检测视频中的关键帧；从所述目标图片中提取文字信息；对所述文字信息进行文本句子分词，获得分词后的句子；对所述分词后的句子进行向量转换，获得所述句子中分词的词向量；将所述分词后的句子和所述词向量输入文本分类模型，通过所述文本分类模型进行语义识别并输出语义识别结果，所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。第二方面，本说明书实施例提供一种视频中文字信息的检测装置，包括：图片提取单元，用于从待检测视频中提取目标图片，其中，所述目标图片包括所述待检测视频中的关键帧；文字提取单元，用于从所述目标图片中提取文字信息；分词单元，用于对所述文字信息进行文本句子分词，获得分词后的句子...

【技术保护点】
1.一种视频中文字信息的检测方法，包括：从待检测视频中提取目标图片，其中，所述目标图片包括所述待检测视频中的关键帧；从所述目标图片中提取文字信息；对所述文字信息进行文本句子分词，获得分词后的句子；对所述分词后的句子进行向量转换，获得所述句子中分词的词向量；将所述分词后的句子和所述词向量输入文本分类模型，通过所述文本分类模型进行语义识别并输出语义识别结果，所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。

【技术特征摘要】
1.一种视频中文字信息的检测方法，包括：从待检测视频中提取目标图片，其中，所述目标图片包括所述待检测视频中的关键帧；从所述目标图片中提取文字信息；对所述文字信息进行文本句子分词，获得分词后的句子；对所述分词后的句子进行向量转换，获得所述句子中分词的词向量；将所述分词后的句子和所述词向量输入文本分类模型，通过所述文本分类模型进行语义识别并输出语义识别结果，所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。2.如权利要求1所述的方法，从待检测视频中提取目标图片，包括：从所述待检测视频中提取评论量大于设定阈值的热点帧，将所述热点帧作为所述目标图片；和/或，从所述待检测视频中随机提取预设数量的随机帧，将所述随机帧作为所述目标图片。3.如权利要求2所述的方法，所述对所述分词后的句子进行向量转换，获得所述句子中分词的词向量，包括：通过中文词向量算法或者自然语言向量转换算法，对所述分词后的句子进行向量转换，获得所述句子中分词的词向量。4.如权利要求1～3任一所述的方法，所述文本分类模型为基于卷积神经网络训练获得的文本分类模型。5.一种视频中文字信息的检测装置，包括：图片提取单元，用于从待检测视频中提取目标图片，其中，所述目标图片包括所述待检测视频中的关键帧；文字提取单元，用于从所述目标图片中提取文字信息；分词单元，用于对所述文字信息进行文本句子分词，获得分词后的句子；向量转换单元，用于对所述分词后的句子进行向量转换，获得所述句子中分词的词向量；识别单元，用于将所述分词后的句子和所述词向量输入文本分类模型，通过所述文本分类模型进行语义识别并输出语义识别结果，所述语义识别结果用于表征所述文字信息中是否包含具有预设语义的文字。6.如权利要求5所述的装置，所述图片提取单...

【专利技术属性】
技术研发人员：曹绍升，孙晓军，周俊，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人