内容数据的处理方法、报告数据的处理方法、计算机设备、存储介质技术

技术编号:28420276 阅读:35 留言:0更新日期:2021-05-11 18:27
本申请实施例公开了一种内容数据的处理方法、报告数据的处理方法、计算机设备、存储介质。依据所述方法,从视频中抽取图片,首先定位内容数据在图片中的目标区域,进一步在目标区域中识别内容数据,一方面可以缩小识别范围,提升识别速度,另一方面,无需识别其他多余信息,可以提高识别的精准度。进一步将内容数据与音频数据进行关联,并提供该关联的内容数据和音频数据,还方便了结合内容数据和音频数据共同使用,并且可以选用其中部分内容数据和对应的音频数据,方便了对关键的内容数据的快速使用。

【技术实现步骤摘要】
内容数据的处理方法、报告数据的处理方法、计算机设备、存储介质
本申请涉及数据处理
,具体涉及一种内容数据的处理方法、一种报告数据的处理方法、一种计算机设备、一种计算机可读存储介质。
技术介绍
随着网络技术的发展,网络资源的广泛性与优越性也为教育教学带来了创新,不仅包括学历教育,工作生活中涉及的短期技能培训也非常内容繁多,已经不断地进入到了人们的学习生活中。线上教学通常采用直播或是录制视频的讲解方式,视频画面记录了讲解者对报告的描述过程,随着时间推移翻阅整个报告,无法快速获取报告内容,若是需要复习或是翻阅重点内容,则需要自行点击查找,比较花费时间。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的内容数据的处理方法、报告数据的处理方法以及计算机设备、计算机可读存储介质。依据本申请的一个方面,提供了一种内容数据的处理方法,包括:从视频中抽取图片;定位所述图片中内容数据所处的目标区域;从所述目标区域中抽取内容数据;从所述视频中本文档来自技高网...

【技术保护点】
1.一种内容数据的处理方法,其特征在于,包括:/n从视频中抽取图片;/n定位所述图片中内容数据所处的目标区域;/n从所述目标区域中抽取内容数据;/n从所述视频中确定与所述内容数据对应的音频数据;/n将所确定的音频数据与对应的内容数据进行关联,并提供关联后的内容数据和音频数据。/n

【技术特征摘要】
1.一种内容数据的处理方法,其特征在于,包括:
从视频中抽取图片;
定位所述图片中内容数据所处的目标区域;
从所述目标区域中抽取内容数据;
从所述视频中确定与所述内容数据对应的音频数据;
将所确定的音频数据与对应的内容数据进行关联,并提供关联后的内容数据和音频数据。


2.根据权利要求1所述的方法,其特征在于,所述从视频中抽取图片包括:
从所述视频中按照设定频率抽取图片。


3.根据权利要求1所述的方法,其特征在于,所述从视频中抽取图片包括:
从所述视频中提取关键帧图片。


4.根据权利要求1所述的方法,其特征在于,所述定位所述图片中内容数据所处的目标区域包括:
识别图片中与内容数据相关的框架信息;
根据所述框架信息确定所述图片中内容数据所处的目标区域。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
按照目标形状对所述目标区域进行形状矫正。


6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述目标区域的尺寸进行标准化。


7.根据权利要求1所述的方法,其特征在于,所述从所述目标区域中抽取内容数据包括:
对所述目标区域进行版面分析和光学字符识别,得到所述目标区域的版面信息和文字信息,以所述版面信息和文本信息作为内容数据。


8.根据权利要求1所述的方法,其特征在于,在所述从所述目标区域中抽取内容数据之后,所述方法还包括:
根据所抽取的内容数据在所述内容数据之间进行去重处理。


9.根据权利要求8所述的方法,其特征在于,所述去除内容数据重复的图片包括:
提取对应图片具有页码的内容数据;
查找对应图片的页码相同的内容数据,并在对应图片的页码相同的内容数据中去除重复的内容数据。


10.根据权利要求8所述的方法,其特征在于,所述根据所抽取的内容数据在所述内容数据之间进行去重处理包括:
确定时序上相邻的内容数据之间关于文本信息和版面信息的相似性数据;
在相似性数据满足设定范围的内容数据中,去除重复的内容数据。


11.根据权利要求8所述的方法,其特征在于,所述根据所抽取的内容数据在所述内容数据之间进行去重处理包括:
提取对应图片具有页码的内容数据;
根据图片的顺序确定重复查看的图片,并去除重复查看的图片对应的内容数据。


12.根据权利要求1所述的方法,其特征在于,在所述...

【专利技术属性】
技术研发人员:郭山裴唯一
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1