【技术实现步骤摘要】
声音数据检索系统及用于该系统的程序
本专利技术涉及检索声音数据的系统。
技术介绍
随着近年来的存储设备的大容量化,能够储存大量的声音数据。在以往的许多声音数据库中,为了管理声音数据而赋予对声音进行录音的时刻的信息,并基于该信息检索希望的声音数据。但是,在基于时刻信息的检索中,需要预先知道讲出希望的声音的时刻,不适合于检索讲话中包含指定的关键字的声音的用途。在检索讲话中包含指定的关键字的声音的情况下,需要将声音从头到尾进行听取。所以,开发了自动地检测讲出声音数据库中的指定的关键字的时刻的技术。在作为代表性的方法之一的子字检索法中,首先通过子字识别(Sub-wordrecognition)处理将声音数据变换为子字串。这里,所谓子字,是指音素(Phoneme)或音节(Syllable)等比单词更小的单位的名称。如果输入关键字,则将该关键字的子字表现与声音数据的子字识别结果进行比较,检测子字的一致度高的部分,由此在声音数据中检测讲出该关键字的时刻(专利文献1、非专利文献1)。此外,在非专利文献2所示出的字定位(wordspotting)法中,通过将音素单位的声学模型(Ac ...
【技术保护点】
一种声音数据检索系统,其特征在于,具备:输入装置,输入关键字;音素变换部,将输入的上述关键字变换为音素标音;声音数据搜索部,基于音素标音的关键字,在声音数据中检索讲出该关键字的部分;对照关键字生成部,基于音素标音的关键字,生成用户有可能听取混淆的与该关键字不同的对照关键字的集合;以及检索结果提示部,向用户提示来自上述声音数据搜索部的检索结果及来自上述对照关键字生成部的上述对照关键字。
【技术特征摘要】
2011.11.18 JP 2011-2524251.一种声音数据检索系统,其特征在于,具备:输入装置,输入关键字;音素变换部,将输入的上述关键字变换为音素标音;声音数据搜索部,基于音素标音的关键字,在声音数据中检索讲出该关键字的部分;对照关键字生成部,基于音素标音的关键字,生成用户有可能听取混淆的与该关键字不同的对照关键字的集合;检索结果提示部,向用户提示来自上述声音数据搜索部的检索结果及来自上述对照关键字生成部的上述对照关键字,以供用户参考上述对照关键字来判断上述检索结果是否正确;以及对照关键字检查部,将由上述对照关键字生成部生成的对照关键字与上述声音数据搜索部的检索结果进行比较,并将不需要的对照关键字除去。2.如权利要求1所述的声音数据检索系统,其特征在于,具备每个用户的音素混淆矩阵;上述对照关键字生成部基于上述音素混淆矩阵进行对照关键字生成。3.如权利要求2所述的声音数据检索系统,其特征在于,具备:语言信息输入部,输入关于用户能够理解的语言的信息;以及音素混淆矩阵生成部,基于从语言信息输入部得到的信息,生成上述音素混淆矩阵。4.如权利要求1所述的声音数据检索系统,其特征在于,上述对照关键字生成部计算被进行上述音素标音后的关键字与登录在单词辞典中的单词的音素标音之间的编辑距离,将编辑距离为阈值以下的单词作为对照关键字。5.如权利要求1所述的声音数据检索系统,其特征在于,具备声音合成部,该声音合成部将用户输入的上述关键字和由上述对照关键字生成部生成的上述对照关键字的某一方或双方进行声音合成;上述检索结果提示部向用户提示来自上述声音合成部的合成声音。6.如权利要求1所述的声音数据检索系统,其特征在于,上述对照关键字检查部将由上述对照关键字生成部生成的上述对照关键字与上述声音数据搜索部的检索结果进行比较,并将不需要的声音数据检索结果除去。7.一种声音...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。