视频数据的处理方法及设备技术

技术编号：38222135 阅读：15 留言：0更新日期：2023-07-25 17:53

本公开的实施例提供一种视频数据的处理方法及设备，涉及计算机技术领域，解决了当前人工验收视频带来的错误率比较大的问题。所述方法包括：获取投放的视频数据，所述视频数据包括口播数据和画面数据；通过asr接口以及开源标点符号断句算法，将所述口播数据进行切分，得到切分后的asr文本；通过ocr接口以及预设无效信息，将所述画面数据中的无效信息进行过滤，得到过滤后的ocr文本；根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则，得到所述视频数据的匹配结果。本公开实施例适用于品牌方针对所投放视频的验收过程。施例适用于品牌方针对所投放视频的验收过程。施例适用于品牌方针对所投放视频的验收过程。

全部详细技术资料下载

【技术实现步骤摘要】
视频数据的处理方法及设备

[0001]本公开的实施例涉及计算机
，具体地涉及一种视频数据的处理方法及设备。

技术介绍

[0002]品牌方为了规范内部品牌线投放视频的质量，需要对不同社交媒体渠道投放的视频做质量把控，以便在视频中能够充分体现产品的卖点。视频制作通常由品牌方提供制作规则或模板，例如，要求视频中必须包含的关键信息，或者不同信息出现在视频的不同时间段、不同位置以及至少需要维持的时间长短等等。
[0003]在规则或者模板制定后，需要对投放的回流视频按照规则或者模板进行检查，查看每条视频是否满足品牌方的要求。但是当前多采用人工逐条视频验收检查，由于需要同时检查视频中的画面与口播，人工检查的错误率比较大。

技术实现思路

[0004]本公开的实施例的目的是提供一种视频数据的处理方法及设备，解决了当前人工验收视频带来的错误率比较大的问题，通过自动执行口播数据和画面数据的相互校验，去除了视频中的无效信息，提高了视频验收过程的准确性。
[0005]为了实现上述目的，根据本公开的第一方面，提供一种视频数据的处理方法，包括：获取投放的视频数据，所述视频数据包括口播数据和画面数据；通过asr接口以及开源标点符号断句算法，将所述口播数据进行切分，得到切分后的asr文本；通过ocr接口以及预设无效信息，将所述画面数据中的无效信息进行过滤，得到过滤后的ocr文本；根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则，得到所述视频数据的匹配结果。
[0006]在本公开的一些实...

【技术保护点】

【技术特征摘要】
1.一种视频数据的处理方法，其特征在于，所述方法包括：获取投放的视频数据，所述视频数据包括口播数据和画面数据；通过asr接口以及开源标点符号断句算法，将所述口播数据进行切分，得到切分后的asr文本；通过ocr接口以及预设无效信息，将所述画面数据中的无效信息进行过滤，得到过滤后的ocr文本；根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则，得到所述视频数据的匹配结果。2.根据权利要求1所述的视频数据的处理方法，其特征在于，所述通过asr接口以及开源标点符号断句算法，将所述口播数据进行切分，得到切分后的asr文本包括：通过asr接口，得到所述口播数据对应的第一类断句集合；将所述第一类断句集合中的断句合并，经所述开源标点符号断句算法对合并后的整段文本进行切分，得到第二类断句集合；将所述第一类断句集合和所述第二类断句集合求交集，得到切分后的asr文本。3.根据权利要求1所述的视频数据的处理方法，其特征在于，所述通过ocr接口以及预设无效信息，将所述画面数据中的无效信息进行过滤，得到过滤后的ocr文本包括：通过ocr接口，将所述画面数据转换为ocr文本；根据所述ocr文本中的文本坐标信息以及预设无效信息中的位置信息与占比信息，将所述ocr文本中的无效信息进行过滤，得到过滤后的ocr文本。4.根据权利要求1所述的视频数据的处理方法，其特征在于，所述根据所述切分后的asr文本、所述过滤后的ocr文本与预设词语匹配规则，得到所述视频数据的匹配结果包括：利用字典树匹配算法，将所述切分后的asr文本和所述过滤后的ocr文本分别与所述预设词语匹配规则中的规定词语进行匹配，得到第一匹配结果；利用拼音发音匹配算法，将所述切分后的asr文本与所述预设词语匹配规则中的规定词语进行相同发音的匹配，得到第二匹配结果；根据所述预设词语匹配规则中的所述口播数据和所述画面数据中的指定词语需同时出现的要求，在所述第一匹配结果与所述第二匹配结果中查找满足要求的词语，得到所述视频数据的匹配结果。5.根据权利要求1所述的视频数据的处理方法，其特征在于，所述方法还包括：将所述画面数据逐帧提取，通过ocr接口得到所有帧画面的ocr文本；根据预设文本去重规则以及DBscan聚类算法，将所有帧画面的ocr文本进行去重处理，得到第一次清洗后的ocr文本；通过asr接口，得到所述口播数据对应的asr文本；利用信息熵和指定阈值，得到所述asr文本对应的asr分词结果与所述第一次清洗后的ocr文本对应的ocr分词结果；...

【专利技术属性】
技术研发人员：范凌，梁天明，
申请(专利权)人：特赞上海信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人