显示控制集成电路制造技术

技术编号:37330198 阅读:26 留言:0更新日期:2023-04-21 23:08
本申请提供可应用于在显示设备中进行实时视频内容文字检测和语音自动生成的显示控制集成电路,该显示控制集成电路包含:预处理电路、字符辨识电路以及后处理电路。该预处理电路可输入视频信号,以取得该视频信号所载有的实时视频内容,且对该实时视频内容进行初步的文字检测,以产生一系列分割的字符图像以显示字幕。该字符辨识电路可分别对该系列分割的字符图像进行字符辨识,以产生系列字符。该后处理电路可对该系列字符进行词汇更正,以选择性地用正确字符取代任一错误字符以产生一个或多个词汇,以供进行语音自动生成。以供进行语音自动生成。以供进行语音自动生成。

【技术实现步骤摘要】
显示控制集成电路


[0001]本专利技术申请是关于显示控制,尤指一种可应用于(applicable to)在显示设备中进行实时视频内容文字检测和语音自动生成的显示控制集成电路。

技术介绍

[0002]依据相关技术,图像至语音(image

to

speech)转换系统可产生人类听得懂的声音,以帮助有需要的人,且可用学习基础的(learning

based)转换架构来实现,例如,经由各种不同的神经网络训练。学习基础的转换架构的辨识结果可以非常准确,但可能发生某些问题。例如,学习基础的转换架构于辨识时所进行的计算的时间复杂度与空间复杂度都极高,提高了辨识所需的时间。因此,需要一种新颖的方法及相关架构,以在无副作用或较少副作用的状况下实现精巧(compact)、快速且可靠的图像至语音转换系统。

技术实现思路

[0003]本专利技术的一个目的在于提供一种可应用于在显示设备中进行实时视频内容文字检测和语音自动生成的显示控制集成电路,以解决上述问题。
[0004]本专利技术的另一目的在于提供一种可应用于在显示设备中进行实时视频内容文字检测和语音自动生成的显示控制集成电路,以将该显示设备配置成精巧、快速且可靠的图像至语音转换系统。
[0005]本专利技术的至少一个实施例提供了一种显示控制集成电路,其是可应用于在显示设备中进行实时视频内容文字检测和语音自动生成。该显示控制集成电路包含预处理电路、耦接至该预处理电路的字符辨识电路、以及耦接至该字符辨识电路的后处理电路。例如,该预处理电路可用于接收视频信号,以取得该视频信号所载有(carry)的实时视频内容,且对该实时视频内容进行初步的(preliminary)文字检测,以产生一系列分割的(segmented)字符图像从而显示字幕;该字符辨识电路可用于分别对该系列分割的字符图像进行字符辨识,以产生对应该字幕的一系列字符;以及该后处理电路可用于对该系列字符进行词汇更正,以选择性地用正确字符取代任一错误字符,以产生一个或多个词汇,以供进行语音自动生成。
[0006]本专利技术的好处之一是,通过仔细设计的显示控制及额外处理机制,本专利技术的显示控制集成电路能在显示视频的期间对图像内容进行实时文字检测,以自动地生成字幕信息,以供转换为语音信息以进行语音输出。另外,本专利技术的显示控制集成电路能提供精巧、快速且可靠的图像至语音转换系统,其可用非学习基础的(non

learning

based)转换架构实现,其中时间复杂度与空间复杂度可被大幅地降低。相较于现有的相关技术,本专利技术的显示控制集成电路能在无副作用或较低副作用的状况下实现具有图像至语音转换功能的显示设备。
[0007]有关本专利技术的特征、实际操作与功效,将结合附图作实施例详细说明如下。
附图说明
[0008]图1为依据本专利技术一个实施例绘示的一种可应用于在显示设备中进行实时视频内容文字检测和语音自动生成的显示控制集成电路的示意图。
[0009]图2为依据本专利技术一个实施例绘示的一种在显示设备诸如图1所示的显示设备中进行实时视频内容文字检测和语音自动生成的方法的实时多重处理控制方案,其中该方法可应用于图1所示的显示设备及其内的显示控制集成电路。
[0010]图3为依据本专利技术一个实施例绘示的该方法的图像滤波及目标区域控制方案。
[0011]图4为依据本专利技术一个实施例绘示的该方法的冗余处理避免(redundant

processing prevention)控制方案。
[0012]图5为依据本专利技术一个实施例绘示的该方法的字符图像隔离/分割(isolation/segmentation)控制方案。
[0013]图6为依据本专利技术一个实施例绘示的该方法的字符分类及辨识控制方案。
[0014]图7为依据本专利技术一个实施例绘示的该方法的词汇更正控制方案。
[0015]图8依据本专利技术一个实施例绘示的该方法的像素基础的(pixel

based)线及背景检测控制方案。
[0016]图9为依据本专利技术一个实施例绘示的该方法的文字图像预处理控制方案。
[0017]符号说明10:显示设备10P:显示输出模块10B:主电路板10A:音频输出模块100:显示控制集成电路(IC)101:图像处理电路110:预处理电路111:文字检测电路111S:储存单元112:去噪电路113:字符隔离电路120:字符辨识电路130:后处理电路140:词汇至语音(V2S)转换电路DP_in:视频输入端子A_out:音频输出端子DP_IN:视频输入埠A_OUT:音频输出埠IMG_IN:视频信号SIG_CHAR:分割的字符图像信号SIG_STRING:字符串信号SIG_VOCABULARY:词汇信号
SIG_SPEECH:语音信号ThinLine_ROI:目标区域Frame(t)~Frame(t+n):框架CLASS_A,CLASS_B,CLASS_C:类别THD:阈值OFFSET:偏移值FEATURE:特征值INT_Background:背景区间INT_ThinLine:线区间L1,L2:垂直参考线BASE,H0,H1,H2:参数θ:倾斜角
具体实施方式
[0018]以下说明内容的技术用语是参照本
的习惯用语,如本说明书对部分用语有加以说明或定义,该部分用语的解释是以本说明书的说明或定义为准。
[0019]图1为依据本专利技术一个实施例绘示的一种可应用于在显示设备10中进行实时视频内容文字检测和语音自动生成的显示控制集成电路(integrated circuit,简称IC)100的示意图,其中显示控制IC 100可位于显示设备10中,尤其,可被安装(mount)于显示设备10的一主电路板10B(例如印刷电路板)上,但本专利技术不限于此。于某些实施例中,主电路板10B可被取代为显示设备10中的另一电路板,诸如一个或多个次要电路板中的任一电路板。
[0020]显示设备10可包含一显示输出模块10P(例如,一显示面板,诸如液晶显示器(Liquid Crystal Display,LCD)面板)、主电路板10B连同其上的显示控制IC 100、音频输出模块10A、一视频输入埠DP_IN以及一音频输出端口A_OUT,而显示控制IC 100可包含多个端子,诸如一视频输入端子DP_in和一音频输出端子A_out,且可包含多个子电路,诸如一图像处理电路101、一预处理电路110、一字符辨识电路120、一后处理电路130以及一词汇至语音(Vocabulary

to

Speech,简称V2S)转换电路140,其中位于图像处理电路101中的一控制电路(未显示)可控制该多个子电路,以控制显示控制IC100的操作。显示控制IC 100可包含一储存单元,以作为该多个子电路的其中之一,而该多个子电路中的某些其它子电路(例如,图像处理电路101、预处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种显示控制集成电路,可应用于在显示设备中进行实时视频内容文字检测和语音自动生成,其特征在于,所述显示控制集成电路包含:预处理电路,用于接收视频信号,以取得所述视频信号所载有的实时视频内容,且对所述实时视频内容进行初步的文字检测,以产生一系列分割的(segmented)字符图像从而显示字幕;字符辨识电路,耦接至所述预处理电路,用于分别对所述系列分割的字符图像进行字符辨识,以产生对应所述字幕的一系列字符;以及后处理电路,耦接至所述字符辨识电路,用于对所述系列字符进行词汇更正,以选择性地用正确字符取代任一错误字符,以产生一个或多个词汇,以供进行语音自动生成。2.如权利要求1所述的显示控制集成电路,其特征在于,所述显示控制集成电路还包含:储存单元,用于储存所述实时视频内容的局部图像,以供进行所述初步的文字检测,其中所述局部图像映射于超过一列的像素资料。3.如权利要求2所述的显示控制集成电路,其特征在于,所述显示控制集成电路包含多个子电路,所述多个子电路包含所述预处理电路、所述字符辨识电路以及所述后处理电路;以及所述储存单元被整合至所述多个子电路的其中之一。4.如权利要求1所述的显示控制集成电路,其特征在于,所述预处理电路还包含:文字检测电路,用于依据所述实时视频内容进行所述初步的文字检测,其中所述文字检测电路对所述实时视频内容进行图像过滤,以产生过滤图像,于所述过滤图像中找出具有多个线(line)的文字区域以作为目标区域,且取得位于所述目标区域的至少一个存在文字(text

existence)图像,以供进一步处理。5.如权利要求4所述的显示控制集成电路,其特征在于,所述预处理电路还包含:去噪(denoise)电路,耦接至所述文字检测电路,用于对所述...

【专利技术属性】
技术研发人员:江冠廷詹钧杰杨升儒
申请(专利权)人:瑞昱半导体股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1