文档读出支持设备和方法技术

技术编号:8532936 阅读:103 留言:0更新日期:2013-04-04 15:59
本发明专利技术涉及文档读出支持设备和方法。根据一个实施例,提供了一种文档读出支持设备,具有第一到第三获取单元(11、12、14)、提取单元(13、确定单元(16)和用户验证单元(17)。第一获取单元(11)获取具有文本的文档。第二获取单元(12)获取具有定义的元数据,每个定义包括适用条件和读出方式。提取单元(13)提取文档的特征。第三获取单元(14)获取执行环境信息。确定单元(16)基于该特征和信息确定读出的参数候选项。用户验证单元(17)展示候选项并接收验证指令。

【技术实现步骤摘要】

在此描述的实施例一般涉及。
技术介绍
近年来,随着计算机资源的发展和硬件的进化,图书数字化(电子书)受到了很多关注。随着图书数字化的发展,用户可获得用来浏览数字化图书的终端或软件程序,且数字化图书内容的销售也变得很普遍。而且,很流行数字化图书创建支持服务。与纸媒相比,数字化图书仍然有不便之处。但是,通过将需要大量纸张作为媒介的书本转换为数字数据,可降低用于递送、存储和购买的努力和成本。此外,可提供诸如搜索或字典查阅的新使用方法。作为数字书才有的一种使用方法,可获得这样的服务,其使用文本语音转换(TTS)系统而读出数字书并允许用户听取该朗读声音。与该服务不同,可常规获得有声读物。但是,有声读物要求旁白录音(narration recording),且在实践中仅提供有限的书本。相反,根据数字书的读出服务,使用合成语音可读出任意文本(与其要旨无关)。因此,用户可享受听取不值得旁白录音的内容(例如,经常更新的内容),或者听取其有声读物没有被期望以朗读语音的形式来制作的内容(例如,用户拥有的任意文档)。但是,不能获得这样的技术,其保证对于与文档数据的读出有关的元数据的用户定制的便利性以及在读出文档数据时使用的系统环境的灵活性,并可防止读出再现性被损害。
技术实现思路
本专利技术的目的是提供一种,其保证对于与文档数据的读出有关的元数据的用户定制的便利性以及在读出文档数据时使用的系统环境的灵活性,并可防止读出再现性被损害。根据实施例,一种文档读出支持设备具有文档获取单元、元数据获取单元、提取单元、执行环境获取单元、确定单元和用户验证单元。文档获取单元被配置为获取包括多个文本数据的文档数据。元数据获取单元被配置为获取包括多个定义的元数据,每个定义包括与定义将被施加的文本数据有关的条件以及用于与所述条件匹配的文本数据的读出方式。提取单元被配置为通过将每个定义施加到包括在文档数据中的文本数据,提取文档数据的特征。提取环境获取单元被配置为获取与其中执行文档数据的读出处理的环境有关的执行环境信息。确定单元被配置为,基于文档数据的特征和执行环境信息,通过将元数据施加到文档数据,确定执行读出处理时使用的参数候选项。用户验证单元被配置为向用户展示参数候选项,并接受包括选择或设定的验证指令。根据文档读出支持设备,可确保对于与文档数据的读出有关的元数据的用户定制的便利性以及在读出文档数据时使用的系统环境的灵活性,并可防止读出再现性被损害。附图说明图1是示出根据实施例的示例性文档读出支持设备的框图;图2是示出设备的示例性处理的流程图;图3是示出输入文档的实例的表;图4是示出元数据的实例的表;图5是示出元数据获取单元的示例性处理的流程图;图6是示出由元数据获取单元获取的示例性转换规则的表;图7是示出输入文档特征提取单元的示例性处理的流程图;图8是示出输入文档特征提取单元的示例性处理结果的表;图9是示出输入文档特征提取单元的示例性处理结果的表;图10是示出执行环境获取单元的示例性执行结果的表;图11是示出用户设置限制获取单元的示例性提取结果的图;图12是示出用户设置限制获取单元的示例性提取结果的表;图13是示出参数确定单元的示例性处理的流程图;以及图14是示出用户验证单元的示例性展示的表。具体实施例方式以下将参考附图详细描述根据本专利技术实施例的文档读出支持设备。注意在以下的实施例中,由相同的参考标号表不的部分执行相同的操作,且其重复描述将被省略。以下将更详细地描述相关技术。已提出了一些使用合成语音来读出数字书的技术。例如,作为这些技术中的一个,已知以下技术。在将被分配的书本的内容数据中,提前限定包括在该书中的角色和其对话之间的对应。然后,用户可自由指定包括在该书中的各个角色与合成语音人物之间的联系,在听取(或观看和听取)内容时(即,在合成语音朗读时)合成语音人物读出角色对话,同时多个合成语音人物的人物影像作为列表被显示。利用该技术,用户可为分配的书本中的角色分配他或她喜欢的合成语音人物的人物语音,并可听取由分配的合成语音读出的该书本。但是,当这样的内容分配和用户定制功能将被实现时,也出现了一些问题。在将被分配的内容数据中,对于每本书,角色和对话须被唯一地并很好地彼此关联。出于该原因,可被用户获得的内容和人物声音对于用户来说是从服务供应商独特分配的,或是由服务供应商所独特分配的组合。将检查这样的框架,其允许用户根据内容自由地编辑朗读方式,并根据与服务供应商无关的特定内容而自由地分配并共享与朗读方式有关的信息。即使在这样的情况下,在朗读方式信息中限定的参数和将被使用的语音人物取决于该创建者的环境。出于这个原因,为了允许想要听取特定内容的用户参考共享的方式信息来再现该内容的朗读方式,该用户必须能使用与方式信息的创建者的环境相同的环境(例如,同一组人物语音、具有同样或更多功能的话音合成引擎等)。这推动了用户必须具有任何和所有的语音人物的必要性,这是不现实的。而且,这意味着书数据的读出处理可仅被内容分配源提供的内容和推荐的环境来实施,且其与用户的前述自由读出环境相差甚远。而且,即使对于同样的用户,该用户用以回放书数据的环境和装置也通常因情况而变化,且用户不会总是使用同样的环境和装置来听取书数据。例如,与其中用户在由诸如台式PC实现的计算机资源的环境中听取来自扬声器的朗读语音的情况相比,如果他或她通过头戴式耳机或耳塞、使用诸如蜂窝电话或平板电脑的移动装置来听取朗读语音,例如,一组可获得的人物语音可被限制或就装置限制而言,限制了要求大计算量的话音合成引擎功能的使用。相反,已知用户仅在特定环境下(例如,当用户在户外使用移动装置时,应用减噪功能)想要激活的功能。但是,根据这样的用户环境差异和/或可获得的计算机资源差异,很难通过灵活地应用朗读方式信息来回放内容。另一方面,以下将检查这样的情况,其中元数据的这种共享和创建以民间(grass-roots)方式被传播给用户,且可获得广泛的变化而不考虑正式或非正式的数据。在这种情况下,用户可享有的选择方式增加,而在回放书本前他们不会认识到作为朗读语音的朗读方式或人物特征。例如,当恶意用户准备了在使用该元数据读取内容时则会引起对应于内容事项的表达不足或突然的极端音量变化的元数据时,或者当例如包括对耳朵不利的读取语音,就解释书本或语音人物的个性而言,即使没有任何危害,根据该元数据的朗读对于所有用户来说不总是优点。不能获得这样的技术,其保证对于与文档数据的读出有关的元数据的用户定制的便利性以及在读出文档数据时使用的系统环境的灵活性,并防止读出再现性被损害。以下将更详细地描述实施例。本实施例将考虑这样的情况,其中在使用合成语音朗读数字书数据时,作为读出处理的技巧的例如感情、语气(tone)、讲话者差异等被限定为元数据,且按需要参考这些元数据,以根据输入文档的内容或特征的表达多样性,实现使用合成语音的朗读。在这种情况下,当信息(元数据)共享并使用对应于内容或专门用于人物语音的朗读方式(读出方式)时,考虑到计算机资源的差异或实际可被用户获得的功能或将被读出的内容差异,允许根据本实施例的文档读出支持设备尝试回放而同时保证再现性(或者在适合用户的情况下再现性可被提高)。以下将示范一种情况作为实际实例,其中用日语读出日语文档。但是本文档来自技高网...

【技术保护点】
一种文档读出支持设备,其特征在于包括:文档获取单元,被配置为获取包括多个文本数据的文档数据;元数据获取单元,被配置为获取包括多个定义的元数据,每个定义包括与定义将被施加的所述文本数据有关的条件以及用于与所述条件匹配的所述文本数据的读出方式;提取单元,被配置为通过将每个所述定义施加到包括在所述文档数据中的所述文本数据,提取所述文档数据的特征;执行环境获取单元,被配置为获取与其中执行所述文档数据的读出处理的环境有关的执行环境信息;确定单元,被配置为,基于所述文档数据的所述特征和所述执行环境信息,通过将所述元数据施加到所述文档数据,确定在执行所述读出处理时使用的参数候选项;以及用户验证单元,被配置为向用户展示所述参数候选项,并接受包括选择或设定的验证指令。

【技术特征摘要】
2011.09.27 JP 211160/20111.一种文档读出支持设备,其特征在于包括文档获取单元,被配置为获取包括多个文本数据的文档数据;元数据获取单元,被配置为获取包括多个定义的元数据,每个定义包括与定义将被施加的所述文本数据有关的条件以及用于与所述条件匹配的所述文本数据的读出方式;提取单元,被配置为通过将每个所述定义施加到包括在所述文档数据中的所述文本数据,提取所述文档数据的特征;执行环境获取单元,被配置为获取与其中执行所述文档数据的读出处理的环境有关的执行环境信息;确定单元,被配置为,基于所述文档数据的所述特征和所述执行环境信息,通过将所述元数据施加到所述文档数据,确定在执行所述读出处理时使用的参数候选项;以及用户验证单元,被配置为向用户展示所述参数候选项,并接受包括选择或设定的验证指令。2.根据权利要求1所述的设备,其特征在于还包括话音合成单元,被配置为使用经由所述用户验证单元设定的所述参数生成用于所述文档数据的朗读语音。3.根据权利要求1所述的设备,其特征在于还包括用户设置限制获取单元,被配置为从用户获取具有高于所述元数据的优先权的用户设置限制。4.根据权利要求3所述的设备,其特征在于所述确定单元考虑到所述用户设置限制而限制参数能呈现的值或取值范围。5.根据权利要求3所述的设备,其特征在于允许所述用户设置限定在所述读出处理中使用的感情表达的改变范围、感情类型和语气、将被读出的词或短语以及音量或节奏的变化范围或值中的至少一个。6.根据权利要求1所述的设备,其特征在于,在提取所述文档数据的所述特征时,所述提取单元通过概括和施加在所述元数据中描述的对应关系从某些定义生成将被施加到整个相关信息的提取规则。7.根据权利要求1所述的设备,其特征...

【专利技术属性】
技术研发人员:布目光生橘健太郎森纮一郎森田真弘清水勇词铃木优
申请(专利权)人:株式会社东芝
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1