分段方法、分段系统及非暂态电脑可读取媒体技术方案

技术编号:23515014 阅读:34 留言:0更新日期:2020-03-18 01:30
本公开内容关于一种分段方法、分段系统及非暂态电脑可读取媒体。该分段方法包含下列步骤:接收影片内容;其中,影片内容包含影像信号以及声音信号;针对影像数据进行分段处理,以产生至少一影像段落标记;针对该声音数据进行分段处理,以产生至少一声音段落标记;以及比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。

Segment method, segment system and non transient computer readable media

【技术实现步骤摘要】
分段方法、分段系统及非暂态电脑可读取媒体
本公开内容关于一种分段方法、分段系统及非暂态电脑可读取媒体,且特别是有关于一种针对视频源的分段方法、分段系统及非暂态电脑可读取媒体。
技术介绍
线上学习平台是指一种将众多学习资料存储于伺服器中,让使用者能通过网际网络连线至伺服器,以随时浏览学习资料的网络服务。在现行的各类线上学习平台中,提供的学习资料类型包含影片、音频、简报、文件或论坛。由于线上学习平台中储存的学习资料数量庞大,为了能够方便使用者的使用,需要针对学习资料的影音内容进行自动分段。因此,如何根据学习影片的声音内容以及影像内容之间的关联性进行处理,达到将学习影片自动分段是本领域待解决的问题。
技术实现思路
本公开内容的第一方面在于提供一种分段方法。该分段方法包含下列步骤:接收影片内容;其中,影片内容包含影像数据以及声音数据;针对影像数据进行分段处理,以产生至少一影像段落标记;针对该声音数据进行分段处理,以产生至少一声音段落标记;以及比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。本公开内容的第二方面在于提供一种分段系统,其包含储存单元以及处理器。储存单元用以储存视频源以及至少一影片内容标记。处理器与储存单元电性连接,用以接收影片内容;其中,影片内容包含影像数据以及声音数据,处理器包含:影像分段单元、声音分段单元以及段落标记产生单元。影像分段单元用以针对影像数据进行分段处理,以产生至少一影像段落标记。声音分段单元与影像分段单元电性连接,用以针对声音数据进行分段处理,以产生至少一声音段落标记。段落标记产生单元与影像分段单元以及声音分段单元电性连接,用以比较至少一影像段落标记的影像标记时间与至少一声音段落标记的声音标记时间之间的差异,以产生至少一影片内容标记。本申请的第三方面在于提供一种非暂态电脑可读取媒体,包含至少一指令程序,由处理器执行至少一指令程序以实行一分段方法,该分段方法包含以下步骤:接收影片内容;其中,影片内容包含影像数据以及声音数据;针对影像数据进行分段处理,以产生至少一影像段落标记;针对该声音数据进行分段处理,以产生至少一声音段落标记;以及比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。本公开的分段方法、分段系统及非暂态电脑可读取媒体,其主要是改进以往利用人工方式进行影片段落标记,耗费大量人力以及时间的问题。分别针对影像信号以及声音信号进行段落标记,再根据影像信号的段落标记以及声音信号的段落标记产生影片内容标记,达到将学习影片自动分段的功能。附图说明为让本申请内容的上述和其他目的、特征、优点与实施例能更明显易懂,对本申请的附图说明如下:图1为根据本申请的一些实施例所绘示的分段系统的示意图;图2为根据本申请的一些实施例所绘示的分段方法的流程图;图3为根据本申请的一些实施例所绘示的步骤S220的流程图;图4为根据本申请的一些实施例所绘示的步骤S222的流程图;图5A为根据本申请的一些实施例所绘示的步骤S223的流程图;图5B为根据本申请的一些实施例所绘示的步骤S223的流程图;以及图6为根据本申请的一些实施例所绘示的步骤S230的流程图。【附图标记说明】100:分段系统110:储存单元130:处理器DB:课程数据库131:影像分段单元132:声音分段单元133:段落标记产生单元200:分段方法S210~S240、S221~S223、S2221~S2223、S2231a~S2233a、S2231b~S2233b、S231~S233:步骤具体实施方式以下将参照图示披露本申请的多个实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本申请。也就是说,在本公开内容部分实施方式中,这些实务上的细节是非必要的。此外,为简化图示起见,一些公知惯用的结构与元件在图示中将以简单示意的方式被绘示。于本文中,当一元件被称为“连接”或“耦接”时,可指“电性连接”或“电性耦接”。“连接”或“耦接”亦可用以表示两个或多个元件间相互搭配操作或互动。此外,虽然本文中使用“第一”、“第二”、…等用语描述不同元件,该用语仅是用以区别以相同技术用语描述的元件或操作。除非上下文清楚指明,否则该用语并非特别指称或暗示次序或顺位,亦非用以限定本专利技术。请参阅图1。图1为根据本申请的一些实施例所绘示的分段系统100的示意图。如图1所绘示,分段系统100包含存储单元110以及处理器130。存储单元110电性连接至处理器130,存储单元110用以存储视频源、至少一影片内容标记以及课程数据库DB。承上述,处理器130包含影像分段单元131、声音分段单元132以及段落标记产生单元133。声音分段单元132与影像分段单元131以及段落标记产生单元133电性连接。于本专利技术各实施例中,存储装置110可以实施为存储装置、硬盘、随身盘、存储卡等。处理器130可以实施为集成电路如微控制单元(microcontroller)、微处理器(microprocessor)、数字信号处理器(digitalsignalprocessor)、特殊应用集成电路(applicationspecificintegratedcircuit,ASIC)、逻辑电路或其他类似元件或上述元件的组合。请参阅图2。图2为根据本申请的一些实施例所绘示的分段方法200的流程图。于一实施例中,图2所示的分段方法200可以应用于图1的分段系统100上,处理器130用以根据下列分段方法200所描述的步骤,针对影像数据以及声音信号进行段落标记以产生影片内容标记。如图2所示,分段方法200首先执行步骤S210接收影片内容。于一实施例中,影片内容包含影像数据以及声音数据。处理器130会分别针对影像数据以及声音数据进行处理,在接下来的步骤中会先针对影像数据进行计算,再针对声音数据进行计算,但本公开不限于此,也可以先针对声音数据进行计算,再针对影像数据进行计算。接着,分段方法200执行步骤S220针对影像数据进行分段处理,以产生至少一影像段落标记。于一实施例中,步骤S220还包含步骤S221~S223,请一并参考图3,图3为根据本申请的一些实施例所绘示的步骤S220的流程图。如图3所示,分段方法200进一步执行步骤S221,选取M个单位的影像数据,并将被选取的影像数据分为当前影像段落。于一实施例中,M个单位以M秒来说明,M个单位也可以实施为M个帧,本公开不以此为限。M秒可以根据影片内容的时间长度进行调整,在此M秒以30秒为例,因此在此步骤中将第0秒的影像数据~第30秒的影像数据作为当前影像段落。接着,分段方法200执行步骤S222针对当前影像段落的内容进行判断,以产生影像内容结果。其中影像内本文档来自技高网...

【技术保护点】
1.一种分段方法,包含:/n接收一影片内容;其中,该影片内容包含一影像数据以及一声音数据;/n针对该影像数据进行分段处理,以产生至少一影像段落标记;/n针对该声音数据进行分段处理,以产生至少一声音段落标记;以及/n比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。/n

【技术特征摘要】
20180907 US 62/728,0821.一种分段方法,包含:
接收一影片内容;其中,该影片内容包含一影像数据以及一声音数据;
针对该影像数据进行分段处理,以产生至少一影像段落标记;
针对该声音数据进行分段处理,以产生至少一声音段落标记;以及
比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。


2.如权利要求1所述的分段方法,其中,所述针对该影像数据进行分段处理,以产生该至少一影像段落标记,还包含:
选取M个单位的该影像数据,并将被选取的影像数据分为一第一影像段落;
针对该第一影像段落的内容进行判断,以产生一影像内容结果;其中该影像内容结果包含一动态内容以及一静态内容;以及
基于该影像内容结果针对该影像数据探测一变化内容,并根据该变化内容的时间位置产生该至少一影像段落标记。


3.如权利要求2所述的分段方法,其中,所述针对该第一影像段落的内容进行判断,以产生该影像内容结果,还包含:
于该第一影像段落中选取T个单位,计算T个单位内的影像的相似度,产生一影像差异结果;
如果该影像差异结果大于一第一影像门槛值,将该第一影像段落的内容判定为该动态内容;以及
如果该影像差异结果不大于该第一影像门槛值,将该第一影像段落的内容判定为该静态内容。


4.如权利要求2所述的分段方法,其中,所述基于该影像内容结果针对该影像数据探测该变化内容,并根据该变化内容的时间位置产生该至少一影像段落标记,还包含:
如果该第一影像段落的内容为该动态内容,计算一第M个单位的影像与一第M+1个单位的影像之间的相似度,以产生一影像差异值;
如果该影像差异值大于一第二影像门槛值,将该第M+1个单位的影像与该第一影像段落合并;以及
如果该影像差异值不大于该第二影像门槛值,在该第M+1个单位的影像的时间位置产生该至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为一第二影像段落。


5.如权利要求2所述的分段方法,其中,所述基于该影像内容结果针对该影像数据探测该变化内容,并在该变化内容的时间位置产生该至少一影像段落标记,还包含:
如果该第一影像段落的内容为该静态内容,计算一第M个单位的影像与一第M+1个单位的影像之间的相似度,以产生一影像差异值;
如果该影像差异值不大于一第二影像门槛值,将该第M+1个单位的影像与该第一影像段落合并;以及
如果该影像差异值大于该第二影像门槛值,在该第M+1个单位的影像的时间位置产生该至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为一第二影像段落。


6.如权利要求1所述的分段方法,其中,所述针对该声音数据进行分段处理,以产生该至少一声音段落标记,还包含:
将该声音数据分别转换成一声音时域信号以及一声音频域信号;
从该声音时域信号中选取一时域区段,并判断该时域区段的振幅是否小于一第一门槛值,如果该时域区段的振幅小于该第一门槛值,产生该至少一声音段落标记;以及
从该声音频域信号中选取一第一频域区段以及一第二频域区段,并判断该第一频域区段与该第二频域区段的频谱强度差异值是否大于一第二门槛值,如果该第一频域区段与该第二频域区段的频谱强度差异值大于该第二门槛值,产生该至少一声音段落标记。


7.一种分段系统,包含:
一储存单元,用以储存一影片内容以及至少一影片内容...

【专利技术属性】
技术研发人员:詹诗涵柯兆轩
申请(专利权)人:台达电子工业股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1