声音识别服务器、电话机、声音识别系统以及声音识别方法技术方案

技术编号:3926205 阅读:388 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供声音识别服务器、电话机、声音识别系统以及声音识别方法。声音识别服务器(200)具备:声音接收部(202),其接收来自电话机(100)的声音;模型存储部(208),其存储用于将声音接收部(202)所接收的声音转换为字符的一个以上的声学模型以及一个以上的语言模型;号码判定部(204),其判定电话机(100)的当前呼出号码以及其它号码;模型选择部(206),其根据当前呼出号码以及其它号码选择模型存储部(208)中存储的声学模型,且根据当前呼出号码选择模型存储部(208)中存储的语言模型;和声音识别部(210),其根据模型选择部(206)所选择的声学模型以及语言模型,将声音接收部(202)所接收的声音转换为字符。

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
以往,例如专利文献1所公开的那样公知有如下的技术在对用户发出的声音进 行声音识别的情况下,根据电话号码来切换声音识别用的词典。另外,例如非专利文献1 所公开的那样,开展了可以在一台终端利用多个电话号码及邮件地址的服务(所谓二合一 (2inl)服务)。专利文献1日本特开2000-10590号公报非专利文献12inl寸一 m co -〉《于厶開発(二合一服务的系统开发),ntt DoCoMo于夕二力;l 夕Y — f ;、 vol. 15No. 3, PI 1—19 在采用了上述现有技术的服务中,当在相同的终端使用多个号码、并针对各个号 码准备不同的语言模型及声学模型时,存在以下问题。即,尽管来自相同终端的发声通常是 同一用户的声音,但是针对各个不同号码按照不同的模型来进行声音识别,并且对各个不 同的模型单独地进行更新,从而有可能使模型的精度变低,声音识别的性能降低。
技术实现思路
因此,本专利技术是鉴于上述问题而完成的,其目的在于,提供声音识别服务器、电话 机、声音识别系统以及声音识别方法,它们能在一台终端中利用多个电话号码的服务中可 提高模型的精度、提高声音识别性能。 为了解决上述课题,本专利技术的声音识别服务器与能在一台终端中利用多个电话号码的电话机连接,且将来自上述电话机的声音转换为字符,该声音识别服务器具备声音接收单元,其接收来自上述电话机的声音;模型存储单元,其存储用于将上述声音接收单元所接收的声音转换为字符的一个以上的声学模型以及一个以上的语言模型;号码判定单元,其判定上述电话机的当前的呼出电话号码即当前呼出号码、以及上述多个电话号码中的除上述当前呼出号码以外的电话号码即其它号码;模型选择单元,其根据上述当前呼出号码以及上述其它号码,选择上述模型存储单元中存储的声学模型,且根据上述当前呼出号码,选择上述模型存储单元中存储的语言模型;和声音识别单元,其根据上述模型选择单元所选择的声学模型以及语言模型,将上述声音接收单元所接收的声音转换为字符。 另外,本专利技术的电话机与将声音转换为字符的声音识别服务器连接,且能在一台终端中利用多个电话号码,该电话机具备声音发送单元,其将来自用户的声音发送至上述声音识别服务器;号码检知单元,其检知该电话机的当前的呼出电话号码即当前呼出号码、以及上述多个电话号码中的除上述当前呼出号码以外的电话号码即其它号码;和号码通知单元,其将上述当前呼出号码以及上述其它号码通知给上述声音识别服务器。 另外,本专利技术的声音识别系统具有能在一台终端中利用多个电话号码的电话机、以及将来自上述电话机的声音转换为字符的声音识别服务器,其中,上述电话机具备声音发送单元,其将来自用户的声音发送至上述声音识别服务器;号码检知单元,其检知该电话 机的当前的呼出电话号码即当前呼出号码、以及上述多个电话号码中的除上述当前呼出号 码以外的电话号码即其它号码;和号码通知单元,其将上述当前呼出号码以及上述其它号 码通知给上述声音识别服务器,上述声音识别服务器具备声音接收单元,其接收来自上述 电话机的声音;模型存储单元,其存储用于将上述声音接收单元所接收的声音转换为字符 的一个以上的声学模型以及一个以上的语言模型;号码判定单元,其判定上述电话机的当 前的呼出电话号码即当前呼出号码、以及上述多个电话号码中的除上述当前呼出号码以外 的电话号码即其它号码;模型选择单元,其根据上述当前呼出号码以及上述其它号码,选择 上述模型存储单元中存储的声学模型,且根据上述当前呼出号码,选择上述模型存储单元 中存储的语言模型;和声音识别单元,其根据上述模型选择单元所选择的声学模型以及语 言模型,将上述声音接收单元所接收的声音转换为字符。 另外,本专利技术的声音识别方法应用于声音识别服务器中,该声音识别服务器与能在一台终端中利用多个电话号码的电话机连接,且将来自上述电话机的声音转换为字符,该声音识别方法的特征在于,具有以下步骤模型存储步骤,上述声音识别服务器的模型存储单元存储用于将来自上述电话机的声音转换为字符的一个以上的声学模型以及一个以上的语言模型;声音接收步骤,上述声音识别服务器的声音接收单元接收来自上述电话机 的声音;号码判定步骤,上述声音识别服务器的号码判定单元判定上述电话机的当前的呼出电话号码即当前呼出号码、以及上述多个电话号码中的除上述当前呼出号码以外的电话 号码即其它号码;模型选择步骤,上述声音识别服务器的模型选择单元根据上述当前呼出 号码以及上述其它号码来选择上述模型存储单元中存储的声学模型,且根据上述当前呼出 号码来选择上述模型存储单元中存储的语言模型;和声音识别步骤,上述声音识别服务器 的声音识别单元根据上述模型选择单元所选择的声学模型以及语言模型,将上述声音接收 单元所接收的声音转换为字符。 此时,在本专利技术的声音识别服务器中优选,上述模型存储单元存储对于一个电话 机所能利用的全部电话号码通用的声学模型,上述模型选择单元也根据上述一个电话机中 任意的上述当前呼出号码以及上述其它号码来选择上述通用的声学模型。 根据本专利技术的,声音识 别服务器的模型选择单元根据当前呼出号码以及其它号码双方来选择声学模型。即,选择 对于当前呼出号码以及其它号码双方通用的声学模型。这是因为本专利技术以一个用户在一台 终端中利用多个电话号码的电话机中的声音识别为前提。即,虽然电话号码不同但用户是 同一个,因此可以通过采用通用的声学模型来提高声音识别的性能。采用通用的声学模型, 尤其在对来自同一终端的新号码的声音进行声音识别时起到良好的效果。即,在现有技术 中,如果是新号码,则很可能没有充分地对可利用的声学模型进行更新,因此导致对新号码 的声音识别性能必然变低,但在本专利技术中,可以对来自新号码的声音使用与现有号码对应 的声学模型,所以提高了对来自新号码的声音的识别精度。另外,通过采用通用的声学模 型,可以减少要存储在声音识别服务器的模型存储单元中的声学模型的数量,由此可以减 少用于存储声学模型的容量。另一方面,对于语言模型,虽然假定为一个用户,但有可能每 个电话号码的话题不同,因此本专利技术的声音识别服务器的模型选择单元仅根据当前呼出号 码来选择语言模型。即,选择专门针对当前呼出号码的语言模型。6 另外,本专利技术的声音识别服务器优选还具有声学模型更新单元,其利用来自上述 一个电话机的全部声音来更新上述通用的声学模型。 利用来自一个电话机的全部声音来更新通用的声学模型,由此能够高精度地进行 声学模型的更新。这是因为与按照每个号码来更新声学模型的情况相比,增加了用于更新 的学习量。 另外,本专利技术的声音识别服务器优选还具有语言模型更新单元,其利用对来自上 述一个电话机的全部声音中的、针对每个上述电话号码的声音的识别结果,更新每个相应 电话号码的语言模型。 利用针对每个电话号码的声音的识别结果来更新每个电话号码的语言模型,由此在每个电话号码的话题不同的情况下,能够专门针对该话题来更新语言模型。 另外,本专利技术的声音识别服务器还具有数据存储单元,其将上述一个电话机可利用的上述多个电话号码、与该电话机的用户识别信息相关联地存储,上述模型选择单元可根据上述当前呼出号码以及上述其它号码来选择上述数据存储单元所存储的用户识别信息,且根据该选择的用本文档来自技高网...

【技术保护点】
一种声音识别服务器,其与能在一台终端中利用多个电话号码的电话机连接,且将来自上述电话机的声音转换为字符,其特征在于,上述声音识别服务器具备:声音接收单元,其接收来自上述电话机的声音;模型存储单元,其存储用于将上述声音接收单元所接收的声音转换为字符的一个以上的声学模型以及一个以上的语言模型;号码判定单元,其判定上述电话机的当前的呼出电话号码即当前呼出号码、以及上述多个电话号码中的除上述当前呼出号码以外的电话号码即其它号码;模型选择单元,其根据上述当前呼出号码以及上述其它号码,选择上述模型存储单元中存储的声学模型,且根据上述当前呼出号码,选择上述模型存储单元中存储的语言模型;和声音识别单元,其根据上述模型选择单元所选择的声学模型以及语言模型,将上述声音接收单元所接收的声音转换为字符。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:张志鹏古川博崇
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1