当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于声控控制下的电视系统技术方案

技术编号:4007669 阅读:124 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种基于声控控制下的电视系统,所述电视系统包括:音频识别模块、媒体处理模块、业务主控模块,其中:所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端上显示出命令对应的媒体文件和相关信息。实施本发明专利技术,通过声控即可完成对电视系统的控制和管理功能,为用户的生活提供便利,也丰富了人们控制数字电视的能力,增加了用户与数字电视之间的互动性,满足了用户的需求和体验度。

【技术实现步骤摘要】

本专利技术涉及数字家庭应用
,具体涉及基于声控控制下的电视系统
技术介绍
随着计算机技术、模式识别等技术的发展,适应不同场合的语音识别系统相继被 开发出来,语音识别及处理技术已经越来越突现出其强大的技术优势。近三十年来,语音识 别在计算机、信息处理、通信与电子系统、自动控制等领域的应用越来越广泛。在许多政府部门、商业机构,语音识别技术的应用,可免除大量操作人员的重复劳 动,既经济又方便。如语音邮件、IP电话和IP传真、电子商务、自动语音应答系统、自动语 音信箱、基于IP的语音、数据、视频的CTI系统、综合语音、数据服务系统、自然语音识别系 统、专家咨询信息服务系统、寻呼服务、故障服务、秘书服务、多媒体综合信息服务、专业特 别服务号(168自动信 息服务系统,112、114、119等信息查询系统)等。因此,广大用户希望 能够利用现代语音识别技术和数字机顶盒技术结合,使电视用户也享受声控带来的乐趣。目前应用最为广泛的为特定人的语音识别系统,在不是该特定人声控命令,或者 背景嘈杂的环境下,改语音识别的识别率低,而且不容易分辨声控命令。
技术实现思路
本专利技术提出一种基于声控控制下的电视系统,旨在通过该声控方式即可实现对电 视系统的管理和控制等功能。为了实现专利技术目的,本专利技术实施例提供了 一种基于声控控制下的电视系统,所述 电视系统包括音频识别模块、媒体处理模块、业务主控模块,其中所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端 上显示出命令对应的媒体文件和相关信息。所述所述的音频识别模块包括预处理模块,用于对输入的原始语音信号进行处理,滤除掉其中的不重要的信息 以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重处理;特征提取模块,用于计算语音的声学参数,并进行特征的计算,以便提取出反映信 号特征的关键特征参数用于后续处理;特征库存储模块,用于为用户提供输入若干次训练语音,经过预处理和特征提取 后得到特征矢量参数,建立或修改训练语音的参考模式库;识别模块,用于将输入的语音提取特征矢量参数后与参考模式库中的模式进行相 似性度量比较,并结合一定的判别规则得出最终的识别结果。所述判别规则包括构词规则,语法规则。所述关键特征参数包括线性预测LPC参数、线谱对LSP参数、LPCC、MFCC、ASCC、感觉加权的线性预测PLP参数、动态差分参数和高阶信号谱类特征、Mel频率倒谱系数(MFCC) 参数。本专利技术实施例具有如下有益效果,通过声控即可完成对电视系统的控制和管理功 能,为用户的生活提供便利,也丰富了人们控制数字电视的能力,增加了用户与数字电视之 间的互动性,满足了用户的需求和体验度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。图1为本专利技术实施例中的基于声控控制下的电视系统结构示意图;图2为本专利技术实施例中的图1中音频识别模块的结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例应理解为仅仅是本专利技术一部分实施例,而不是全部的实施 例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其它实施例,都属于本专利技术保护的范围。本专利技术提供一种浏览器测试系统及其方法,能够大大提高浏览器测试的效率和结 果的可靠性。以下分别进行详细说明。图1示出了本专利技术实施例中的基于声控控制下的电视系统结构示意图,包括音频识别模块、媒体处理模块、业务主控模块,其中所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端 上显示出命令对应的媒体文件和相关信息。其中图2示出了本专利技术实施例中音频识别模块的结构示意图,该音频识别模块 包括预处理模块,用于对输入的原始语音信号进行处理,滤除掉其中的不重要的信息 以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重处理;特征提取模块,用于计算语音的声学参数,并进行特征的计算,以便提取出反映信 号特征的关键特征参数用于后续处理;关键特征参数包括线性预测LPC参数、线谱对LSP 参数、LPCC、MFCC、ASCC、感觉加权的线性预测PLP参数、动态差分参数和高阶信号谱类特 征、Mel频率倒谱系数MFCC参数等等。特征库存储模块,用于为用户提供输入若干次训练语音,经过预处理和特征提取 后得到特征矢量参数,建立或修改训练语音的参考模式库;判别规则包括构词规则,语法 规则。识别模块,用于将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则得出最终的识别结果。具体的可以知道,该音频识别模块具有如下功能预处理流程对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及 背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理。特征提取流程负责计算语音的声学参数,并进行特征的计算,以便提取出反映信 号特征的关键特征参数用于后续处理。现在较常用的特征参数有线性预测(LPC)参数、线 谱对(LSP)参数、LPCC、MFCC、ASCC、感觉加权的线性预测(PLP)参数、动态差分参数和高阶 信号谱类特征等。其中,Mel频率倒谱系数(MFCC)参数因其良好的抗噪性和鲁棒性而 应用广泛。训练阶段流程用户输入若干次训练语音,经过预处理和特征提取后得到特征矢 量参数,建立或修改训练语音的参考模式库。识别阶段流程将输入的语音提取特征矢量参数后与参考模式库中的模式进行相 似性度量比较,并结合一定的判别规则和专家知识(如构词规则,语法规则等)得出最终的 识别结果。对于本专利技术实施例中的数据流方式如下业务处理模块接收音频识别模块发出的命令,如果发出的是情景命令,业务处理 模块调用业务显示模块,对命令进行解释,并显示主节目菜单;业务处理模块接收音频识别模块发出的命令,如果发出的是电视点播命令,业务 处理模块调用图形模块,对命令进行解释,并显示已有的点播节目让观众选择;业务处理模块接收音频识别模块发出的命令,如果发出的是网络命令,业务处理 模块调用网络模块,对命令进行解释,并提供股市行情、票务信息、电子报纸、热门网站等各 种信息及软件在线升级功能让观众选择;业务处理模块接收音频识别模块发出的命令,业务处理模块调用视频语音模块, 对命令进行解释,然后完成数字电视视频功能对话。对于音频识别模块,在观众发出命令后,音频识别模块对声音进行采集,加以判断和 分析,看看是否合法操作,如果是合法操作,对命令进行解释,然后发送命令到业务主控模块。业务主控模块接受命令后,对需要的模块进行调用,通过该模块的调用完成所需 功能。综上,通过声控即可完成对电视系统的控制和管理功能,为用户的生活提供便利, 也本文档来自技高网...

【技术保护点】
一种基于声控控制下的电视系统,其特征在于,所述电视系统包括:音频识别模块、媒体处理模块、业务主控模块,其中:所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端上显示出命令对应的媒体文件和相关信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:罗笑南陆剑华
申请(专利权)人:中山大学
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利