标记辅助设备、方法和程序技术

技术编号:8532850 阅读:260 留言:0更新日期:2013-04-04 15:52
本发明专利技术涉及标记辅助设备、方法和程序。根据一个实施例,一种标记辅助设备(200)包括获取单元(205)、第一计算单元(208)、检测单元(207)和展示单元(210)。所述获取单元(205)获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理。所述第一计算单元(208)针对各个字符串计算在标记文本中被分配给所述字符串的所述标签的特征量的方差。所述检测单元(207)检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差。所述展示单元(210)展示所述第一候选项。

【技术实现步骤摘要】

本文中描述的实施例一般而言涉及标记(markup)辅助设备、方法和程序。
技术介绍
手动标记整个大规模的、非结构化的文本数据项(例如电子书)是很困难的。使用机器学习技术,标记处理可被自动化。然而,很难无任何错误地执行自动标记处理。特别地,在文本转语音(text-to-speech)控制中使用的标签(tag)(韵律、感情、讲话者等)对于各个用户来说通常是不同的,且没有唯一正确的答案。因此,由于依赖于用户的主观观点和偏好而使判断会有波动,标记处理的负载变重。
技术实现思路
在一个方面中,提供一种标记辅助设备,其特征在于包括获取单元,其被配置为获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理,所述标记文本包括被分配有至少一个标签的字符串,所述特征量是用于定义指示标签间的相似程度的第一相似度的值;第一计算单元,其被配置为针对各个字符串,计算在标记文本中被分配给所述字符串的所述标签的特征量的方差;检测单元,其被配置为检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差;以及展示单元,其被配置为展示所述第一候选项。在另一个方面中,本文档来自技高网...

【技术保护点】
一种标记辅助设备,其特征在于包括:获取单元,其被配置为获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理,所述标记文本包括被分配有至少一个标签的字符串,所述特征量是用于定义指示标签间的相似程度的第一相似度的值;第一计算单元,其被配置为针对各个字符串,计算在标记文本中被分配给所述字符串的所述标签的特征量的方差;检测单元,其被配置为检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差;以及展示单元,其被配置为展示所述第一候选项。

【技术特征摘要】
2011.09.26 JP 209849/20111.一种标记辅助设备,其特征在于包括 获取单元,其被配置为获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理,所述标记文本包括被分配有至少一个标签的字符串,所述特征量是用于定义指示标签间的相似程度的第一相似度的值; 第一计算单元,其被配置为针对各个字符串,计算在标记文本中被分配给所述字符串的所述标签的特征量的方差; 检测单元,其被配置为检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差;以及展示单元,其被配置为展示所述第一候选项。2.根据权利要求1所述的设备,其特征在于还包括第二计算单元,所述第二计算单元被配置为基于由各个用户分配给每个字符串的标签的所述特征量而计算指示所述用户间的相似程度的第二相似度,并基于由其第二相似度不小于第二阈值的第一用户分配的标签而选择第二候选项,所述第二候选项指示将被分配给所述第一候选项的标签的候选项, 其中展示单元还展示所述第二候选项。3.根据权利要求1所述的设备,其特征在于还包括标签分配单元,所述标签分配单元被配置为基于由至少一个用户编辑的所述标记文本而将所述标签分配给所述字符串。4.根据权利要求1所述的设备,其特征在于,所述获取单元根据指令信号而改变所述第一相似度。5.根据权利要求2所述的设备,其特征在于,所述展示单元展示彼此关联的所述第二候选项和所述第一候选项。6.根据权利要求2所述的设备,其特征在于,所述第二计算单元通过合并多个第二候选项而生成新标签。7.—种标记辅助方法,其特征在于包括 获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理,所述标记文本包括被分配有至少一个标签的字符串,所述特征量是用于定义指示标签间的相似程度的第一相似度的值; 针对各个字符串,计算在标记文本中被分配给所述字符串的所述标签的特征量的方差; 检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差;以及展示所述第一候选项。8.根据权利要求7所述的方法,其特征在于还包括基于由各个用户分配给每个字符串的标签的所述特征量而计算指示所述用户间的相似程度的第二...

【专利技术属性】
技术研发人员:森纮一郎森田真弘
申请(专利权)人:株式会社东芝
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1