信息处理设备以及方法技术

技术编号:11611899 阅读:45 留言:0更新日期:2015-06-17 12:17
根据实施例,信息处理设备包括存储器控制器、检测器、获取器、检索器、确定器、显示控制器、历史更新器、选择器和阈值更新器。存储器控制器在存储器中存储语音文本中的字符串、节点索引、识别得分和语音索引。检测器检测再现区段信息。获取器获取朗读信息和插入位置信息。检索器从语音索引中的多个字符串中指定字符串作为检索的目标字符串。当对应于由检索器获取的字符串的语音识别得分的值等于或大于显示阈值时,确定器确定显示该字符串。显示控制器在显示单元上显示所确定的字符串。历史更新器执行储存控制,以在候选历史存储器中存储候选历史数据。当由显示控制器显示的字符串受到选择操作时,选择器选择字符串。阈值更新器决定显示阈值。

【技术实现步骤摘要】
【专利说明】相关申请的交叉引用本申请基于并要求于2013年12月13日提交的日本专利申请N0.2013-258077的优先权;其全部内容通过引用的方式并入本文中。
本文所述的实施例总体上涉及一种。
技术介绍
典型地,已知了能够使得将语音数据转换为文本的任务(下文中称为转录任务)简化的各种技术。例如,已知了一种技术,其中,当用户在转录任务过程中输入字符的同时,估计从用于转录的目标语音数据最终输入的短语,并呈现给用户。此外,已知了诸如输入估计技术或者估计转换技术的字符输入技术,其中,除了显示已经输入的朗读字符串的假名-汉字转换候选以外,显示估计为跟随在朗读字符串之后的字符串,作为转换候选字符串(下文中称为估计候选)。然而,每一次呈现输入候选时,都必须准备好朗读信息。因此,即使在用户选择(接受)呈现给他或她的输入候选的情况下,仍然必须准备好朗读信息,以便呈现下一个输入候选。因而,在选择了输入候选后,用户再次需要执行字符输入,从而导致工作效率降低。此外,对于语音识别精度低的语音数据,有可能连续呈现不正确的输入候选。结果,输入候选妨碍了用户,从而导致工作效率降低。此外,在传统字符输入技术中,仅使用假名-汉字转换字典来产生输入候选,在字典中,将朗读字符串与假名-汉字转换后的字符相关联,并使用字符输入历史信息。这导致在转录任务过程中工作效率的降低。此外,在专门用于以用户所选估计候选开始的字符串的转换字典(估计转换字典)中检索会跟随在所选估计候选之后的候选(下文中称为后继候选)。为此,为了连续输入长字符串(例如,以句子为单位的),就必须在估计转换字典中还保存长字符串。结果,估计转换字典的大小不断增大,从而导致估计候选的检索效率降低。
技术实现思路
本文所述的实施例的目的是提供一种能够简化转录任务的信息处理设备和方法。根据实施例,信息处理设备的包括:存储器控制器、检测器、获取器、检索器、确定器、显示控制器、历史更新器、选择器和阈值更新器。存储器控制器在存储器中存储:多个字符串,所述多个字符串包含在通过对语音数据执行语音识别而获取的语音文本中;节点索弓丨,所述节点索引指示所述语音文本中的所述字符串的中的每一个字符串的开始位置信息和结束位置信息;语音识别得分,所述语音识别得分通过执行所述语音识别果而获取;以及语音位置信息的语音索引,所述语音位置信息的语音索引指示所述语音数据中的所述字符串中的每一个字符串的位置。检测器检测再现区段信息,其指示语音数据中的再现区段。获取器获取朗读信息,所述朗读信息是表示依据再现的语音数据写下的文本中的短语的朗读的字符串的至少一部分,并且所述获取器获取插入位置信息,其指示在书写文本中的字符插入位置。检索器从储存在存储器中的多个字符串中指定字符串作为检索的目标字符串,其具有包括在再现区段信息中的相应的语音位置信息,并在指定字符串中检索包括由朗读信息所指示的朗读的字符串。当对应于由检索器获取的字符串的语音识别得分的值等于或大于显示阈值时,确定器进行确定以显示由检索器获取的字符串。显示控制器在显示单元上显示由确定器所确定的字符串。历史更新器执行储存控制,以在候选历史存储器中存储候选历史数据,在其中,将由检索器获取的字符串、语音识别得分与字符插入位置相关联,并按照文本的变化来更新候选历史数据。当由显示控制器显示的字符串受到选择操作时,选择器选择该字符串。阈值更新器使用候选历史数据的语音识别得分与由选择器选择的字符串的语音识别得分的至少其中之一来对显示阈值作出决定,所述显示阈值用于通过确定器来与语音识别得分相比较。根据上述的信息处理设备,可以简化转录任务。【附图说明】图1是根据第一实施例的信息处理设备的功能方框图;图2是示出语音识别结果的网格结构的示例的图示;图3是示出作为对于语音数据执行语音识别的结果而获取的示例性网格结构的图示;图4是示出候选历史数据的示例的图示;图5是用于解释在根据第一实施例的信息处理设备中执行的操作的流程图;图6是用于解释当获取朗读信息时阈值更新器更新显示阈值的操作的细节的流程图;图7是用于解释当用户已选择候选时阈值更新器更新显示阈值的操作的流程图;图8是示出用户操作和候选显示的示例的图示;图9是根据第二实施例的信息处理设备的功能方框图;图10是用于解释在根据第二实施例的信息处理设备中执行的操作的流程图;图11是示出用户操作和多个候选显示的示例的图示;图12是根据第三实施例的信息处理设备的功能方框图;图13是用于解释将网格结构转换为特里结构而执行的操作的流程图;图14是示出转换为特里结构的语音识别结果的列表的示例的图示;以及图15是示出语音识别结果的特里结构的示例的图示。【具体实施方式】以下参考附图详细说明多个实施例。本文所述的实施例仅是示例性的,并非唯一可能的实施例。可以使用所谓的个人计算机设备来实施根据实施例的信息处理设备。在此,使用个人计算机设备实施的信息处理设备具有再现语音数据的功能,以及具有用于按照操作者(下文中称为用户)的操作产生文本的文本产生功能。在转录任务过程中,在再现已经记录的语音数据的同时,用户为了将语音数据转换为文本,操作键盘并执行文本输入。概要在根据实施例的信息处理设备中,作为与输入候选有关的信息附带了表示作为语音识别的结果而获取的语音识别得分和结束节点索引的信息。随后,将具有等于或大于特定阈值(下文中称为显示阈值)的语音识别得分的输入候选呈现给用户。如果用户选择呈现给他或她的输入候选,就获取与所选择的输入候选的结束节点索引有关的信息;取回以获取的结束节点索引开始的输入候选,并作为输入候选呈现给用户。此外,在信息处理设备中,输入候选的字符串的语音识别得分与字符插入位置彼此相关联,将关联信息存储为候选历史数据。随后,使用(I)候选历史数据的语音识别得分和(2)输入候选的用户选择来决定显示阈值。因此,在语音识别的结果不令人满意的情况下,可以避免呈现多余的输入候选。此外,在选择输入候选的同时,可以使得用户可以选择跟随在所选择候选之后的输入候选。这能够实现转录任务进一步地简化。第一实施例图1是根据第一实施例的信息处理设备的功能方框图。如图1所示的,信息处理设备包括第一存储器1、第二存储器2、再现器3、再现指令接收器4、再现控制器5、检测器6、获取器7、检索器8、显示控制器9、选择器10、后继检索器11、阈值更新器12、确定器13、第三存储器14和历史更新器15。在此,再现器3到确定器13和历史更新器15可以全部使用软件或使用硬件来实施。可替换地,这些组成元件中的一些可以使用软件来实施,而剩余组成元件可以使用硬件来实施。第一存储器I在其中存储语音数据。关于语音数据,可以使用WAV格式或mp3格式的语音文件。同时,可以通过实施任意的方法来获取语音数据。例如,可以经由诸如互联网的网络获取语音数据,或者可以使用话筒设备来获取语音数据。第二存储器2在其中存储包含在语音文本中的多个字符串,所述语音文本通过对语音数据执行语音识别而获取,并且第二存储器2在其中存储语音位置的语音索引,所述语音位置的语音索引指示语音数据中的字符串中的每一个字符串的位置。此外,第二存储器2在其中存储可靠性的程度(下文中称为语音识别得分),它是在语音识别过程中计算的。检索器8代表存储器控本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN104715005.html" title="信息处理设备以及方法原文来自X技术">信息处理设备以及方法</a>

【技术保护点】
一种信息处理设备,包括:存储器控制器,所述存储器控制器用于在存储器中储存:多个字符串,所述多个字符串包含在通过对语音数据执行语音识别而获取的语音文本中;节点索引,所述节点索引指示所述语音文本中的所述字符串的中的每一个字符串的开始位置信息和结束位置信息;语音识别得分,所述语音识别得分通过执行所述语音识别而获取;以及语音位置信息的语音索引,所述语音位置信息的语音索引指示所述语音数据中的所述字符串中的每一个字符串的位置;检测器,所述检测器用于检测再现区段信息,所述再现区段信息指示所述语音数据中的再现区段;获取器,所述获取器用于获取朗读信息以及获取插入位置信息,所述朗读信息是表示依据已经再现的语音数据而写下的文本中的短语的朗读的字符串的至少一部分,所述插入位置信息指示所述书写文本中的字符插入位置;检索器,所述检索器用于从储存在所述存储器中的所述多个字符串中指定字符串作为检索的目标字符串,所述字符串具有包含在所述再现区段信息中的相应的所述语音位置信息,并且所述检索器用于在所指定的字符串中检索包括由所述朗读信息指示的朗读的字符串;确定器,所述确定器用于当与由所述检索器获取的字符串相对应的所述语音识别得分的值等于或大于显示阈值时,确定显示由所述检索器获取的字符串;显示控制器,所述显示控制器用于在显示单元上显示由所述确定器所确定的字符串;历史更新器,所述历史更新器用于执行储存控制,以将候选历史数据存储在候选历史存储器中,在所述候选历史数据中,由所述检索器获取的字符串、所述语音识别得分以及所述字符插入位置相关联,并且所述历史更新器用于根据文本的变化来更新所述候选历史数据;选择器,所述选择器用于当由所述显示控制器显示的字符串受到选择操作时,选择受到所述选择操作的所述字符串;以及阈值更新器,所述阈值更新器用于使用所述候选历史数据的语音识别得分和由所述选择器选择的所述字符串的语音识别得分的至少其中之一来对所述显示阈值作出决定,所述显示阈值用于通过所述确定器来与语音识别得分相比较。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:芦川平上野晃嗣
申请(专利权)人:株式会社东芝
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1