信息处理设备及其方法技术

技术编号：3045596 阅读：190 留言：0更新日期：2012-04-11 18:40

一种信息处理设备，包括：存储器，用于存储多个语音信号；文本生成器，用于通过对语音信号进行语音识别，生成多个语言文本；关键字提取器，用于从语言文本中提取多个关键字；以及显示设备，用于动态地显示关键字。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种信息处理设备，更具体地说，涉及一种基于语音识别结果的信息处理设备以输出语言信息、及其信息处理方法。
技术介绍
近年来有关使用通过语音信号的语音识别结果所获得的语言信息的元数据生成的研究非常盛行。将所生成的元数据应用到语音信号中对于数据管理或搜索非常有用。例如，日本专利申请公开第8-249343号提供了一种通过从音频数据的语音识别结果所获得的语言文本中提取特定表达和关键字、并将其编入索引以建立音频数据库来实现期望的音频数据的搜索的技术。已经存在一种技术，将通过语音识别结果获得的语言文本用作数据管理或搜索的元数据。但是，还没有动态地显示语音识别结果的语言文本以便使用户能够容易地理解语音内容和相应于所述语音的视频内容、并执行重放控制的技术。本专利技术的目的是提供一种通过语音识别能够生成语言文本并动态地显示所述语言文本的。
技术实现思路
根据本专利技术的一个方面，提供一种使用视频-音频信号的信息处理设备，包括语音重放单元，用于从视频-音频信号重放语音信号；语音识别单元，用于对语音信号进行语音识别；文本生成器，通过使用语音识别单元的语音识别结果，用于生成具有语言要素和用于与语音信号的重放同步的时间信息的语言文本；呈现单元，用于有选择地与语音重放单元重放的语音信号同步呈现语言要素和时间信息。根据本专利技术的另一方面，提供一种信息处理方法，包括对语音信号进行语音识别以获取语音识别结果；根据语音识别结果生成包括语言要素和用于与语音信号的重放同步的时间信息的语言文本；重放语音信号；以及有选择地与重放语音信号同步显示语言要素和时间信息。根据本专利技术的第三方...

【技术保护点】
一种信息处理设备，包括：存储器，用于存储多个语音信号；文本生成器，用于通过对语音信号进行语音识别，生成多个语言文本；关键字提取器，用于从语言文本中提取多个关键字；以及显示设备，用于动态地显示关键字。

【技术特征摘要】
JP 2003-8-15 207622/20031.一种信息处理设备，包括存储器，用于存储多个语音信号；文本生成器，用于通过对语音信号进行语音识别，生成多个语言文本；关键字提取器，用于从语言文本中提取多个关键字；以及显示设备，用于动态地显示关键字。2.根据权利要求1所述的设备，其中显示设备针对每一个语言文本动态地显示多个关键字。3.根据权利要求1所述的设备，还包括选择器，用于从存储器的语音信号中选择与多个关键字中用户所指定的关键字相对应的语音信号；以及语音再现单元，用于再现选择器所选择的语音信号。4.根据权利要求3所述的设备，其中显示设备针对每一个语言文本动态地显示多个关键字。5.根据权利要求3所述并适用用户终端的设备，还包括发送器，用于通过...

【专利技术属性】
技术研发人员：阿部一彦，河村聪典，正井康之，矢岛真人，桃崎浩平，笹岛宗彦，山本幸一，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人