视频数据的处理方法及设备技术

技术编号:38222135 阅读:15 留言:0更新日期:2023-07-25 17:53
本公开的实施例提供一种视频数据的处理方法及设备,涉及计算机技术领域,解决了当前人工验收视频带来的错误率比较大的问题。所述方法包括:获取投放的视频数据,所述视频数据包括口播数据和画面数据;通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本;通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本;根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果。本公开实施例适用于品牌方针对所投放视频的验收过程。施例适用于品牌方针对所投放视频的验收过程。施例适用于品牌方针对所投放视频的验收过程。

【技术实现步骤摘要】
视频数据的处理方法及设备


[0001]本公开的实施例涉及计算机
,具体地涉及一种视频数据的处理方法及设备。

技术介绍

[0002]品牌方为了规范内部品牌线投放视频的质量,需要对不同社交媒体渠道投放的视频做质量把控,以便在视频中能够充分体现产品的卖点。视频制作通常由品牌方提供制作规则或模板,例如,要求视频中必须包含的关键信息,或者不同信息出现在视频的不同时间段、不同位置以及至少需要维持的时间长短等等。
[0003]在规则或者模板制定后,需要对投放的回流视频按照规则或者模板进行检查,查看每条视频是否满足品牌方的要求。但是当前多采用人工逐条视频验收检查,由于需要同时检查视频中的画面与口播,人工检查的错误率比较大。

技术实现思路

[0004]本公开的实施例的目的是提供一种视频数据的处理方法及设备,解决了当前人工验收视频带来的错误率比较大的问题,通过自动执行口播数据和画面数据的相互校验,去除了视频中的无效信息,提高了视频验收过程的准确性。
[0005]为了实现上述目的,根据本公开的第一方面,提供一种视频数据的处理方法,包括:获取投放的视频数据,所述视频数据包括口播数据和画面数据;通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本;通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本;根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果。
[0006]在本公开的一些实施例中,所述通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本包括:通过asr接口,得到所述口播数据对应的第一类断句集合;将所述第一类断句集合中的断句合并,经所述开源标点符号断句算法对合并后的整段文本进行切分,得到第二类断句集合;将所述第一类断句集合和所述第二类断句集合求交集,得到切分后的asr文本。
[0007]在本公开的一些实施例中,所述通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本包括:通过ocr接口,将所述画面数据转换为ocr文本;根据所述ocr文本中的文本坐标信息以及预设无效信息中的位置信息与占比信息,将所述ocr文本中的无效信息进行过滤,得到过滤后的ocr文本。
[0008]在本公开的一些实施例中,所述根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果包括:利用字典树匹配算法,将所述切分后的asr文本和所述过滤后的ocr文本分别与所述预设词语匹配规则中的规定词语进行匹配,得到第一匹配结果;利用拼音发音匹配算法,将所述切分后的asr文本与所述预设
词语匹配规则中的规定词语进行相同发音的匹配,得到第二匹配结果;根据所述预设词语匹配规则中的所述口播数据和所述画面数据中的指定词语需同时出现的要求,在所述第一匹配结果与所述第二匹配结果中查找满足要求的词语,得到所述视频数据的匹配结果。
[0009]在本公开的一些实施例中,所述方法还包括:将所述画面数据逐帧提取,通过ocr接口得到所有帧画面的ocr文本;根据预设文本去重规则以及DBscan聚类算法,将所有帧画面的ocr文本进行去重处理,得到第一次清洗后的ocr文本;通过asr接口,得到所述口播数据对应的asr文本;利用信息熵和指定阈值,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果;利用TF

IDF算法与指定词性,对所述asr分词结果与所述ocr分词结果进行过滤,得到asr新词包与ocr新词包。
[0010]在本公开的一些实施例中,所述根据预设文本去重规则以及DBscan聚类算法,将所有帧画面的ocr文本进行去重处理,得到第一次清洗后的ocr文本包括:根据所述预设文本去重规则中的预设重合度、最长公共子序列比率和文本相似度,将满足条件的ocr文本的位置在二维矩阵中进行标识,得到二维矩阵中的ocr文本元素;利用DBscan聚类算法,将所述二维矩阵中的ocr文本元素进行聚类,得到第一次清洗后的ocr文本。
[0011]在本公开的一些实施例中,所述利用信息熵和指定阈值,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果包括:分别计算所述asr文本与所述第一次清洗后的ocr文本中,每相邻两个字之间的信息熵;利用所述指定阈值筛选所述信息熵,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果。
[0012]在本公开的一些实施例中,所述利用TF

IDF算法与指定词性,对所述asr分词结果与所述ocr分词结果进行过滤,得到asr新词包与ocr新词包包括:利用TF

IDF算法,计算所述asr分词结果与所述ocr分词结果中的词语的分值,并按照所述分值进行排序,得到重要性由高到低进行排序的asr分词与ocr分词;利用所述指定词性,筛选所述asr分词与所述ocr分词,得到所述asr新词包与所述ocr新词包。
[0013]在本公开的一些实施例中,所述方法还包括:将所述切分后的asr文本、所述过滤后的ocr文本分别对应与所述asr新词包与所述ocr新词包进行匹配,得到新词匹配频次。
[0014]根据本公开的第二方面,提供了一种视频数据的处理设备,包括处理器、存储器及存储在存储器上并可在所述处理器上运行的程序。所述处理器执行程序时可执行以下步骤:获取投放的视频数据,所述视频数据包括口播数据和画面数据;通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本;通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本;根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果。
[0015]根据本公开的第三方面,提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行如上所述的视频数据的处理方法。
[0016]本公开的实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0017]附图是用来提供对本公开的实施例的进一步理解,并且构成说明书的一部分,与
下面的具体实施方式一起用于解释本公开的实施例,但并不构成对本公开的实施例的限制。在附图中:
[0018]图1是根据本公开的实施例提供的一种视频数据的处理方法的流程示意图;
[0019]图2是根据本公开的实施例的扩展词包匹配的流程示意图;
[0020]图3是根据本公开的实施例的ocr文本去重的示意图;
[0021]图4是根据本公开的实施例的ocr文本元素聚类的示意图;
[0022]图5是根据本公开的实施例提供统计所有新词在不同视频中出现的频次的示意图;
[0023]图6是根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频数据的处理方法,其特征在于,所述方法包括:获取投放的视频数据,所述视频数据包括口播数据和画面数据;通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本;通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本;根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果。2.根据权利要求1所述的视频数据的处理方法,其特征在于,所述通过asr接口以及开源标点符号断句算法,将所述口播数据进行切分,得到切分后的asr文本包括:通过asr接口,得到所述口播数据对应的第一类断句集合;将所述第一类断句集合中的断句合并,经所述开源标点符号断句算法对合并后的整段文本进行切分,得到第二类断句集合;将所述第一类断句集合和所述第二类断句集合求交集,得到切分后的asr文本。3.根据权利要求1所述的视频数据的处理方法,其特征在于,所述通过ocr接口以及预设无效信息,将所述画面数据中的无效信息进行过滤,得到过滤后的ocr文本包括:通过ocr接口,将所述画面数据转换为ocr文本;根据所述ocr文本中的文本坐标信息以及预设无效信息中的位置信息与占比信息,将所述ocr文本中的无效信息进行过滤,得到过滤后的ocr文本。4.根据权利要求1所述的视频数据的处理方法,其特征在于,所述根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则,得到所述视频数据的匹配结果包括:利用字典树匹配算法,将所述切分后的asr文本和所述过滤后的ocr文本分别与所述预设词语匹配规则中的规定词语进行匹配,得到第一匹配结果;利用拼音发音匹配算法,将所述切分后的asr文本与所述预设词语匹配规则中的规定词语进行相同发音的匹配,得到第二匹配结果;根据所述预设词语匹配规则中的所述口播数据和所述画面数据中的指定词语需同时出现的要求,在所述第一匹配结果与所述第二匹配结果中查找满足要求的词语,得到所述视频数据的匹配结果。5.根据权利要求1所述的视频数据的处理方法,其特征在于,所述方法还包括:将所述画面数据逐帧提取,通过ocr接口得到所有帧画面的ocr文本;根据预设文本去重规则以及DBscan聚类算法,将所有帧画面的ocr文本进行去重处理,得到第一次清洗后的ocr文本;通过asr接口,得到所述口播数据对应的asr文本;利用信息熵和指定阈值,得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果;...

【专利技术属性】
技术研发人员:范凌梁天明
申请(专利权)人:特赞上海信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1