一种视听字幕制作系统及方法技术方案

技术编号：8347921 阅读：240 留言：0更新日期：2013-02-21 01:22

本发明专利技术提供了一种视听字幕制作系统及方法，所述系统包括原始文本处理模块、注音模块、原始声音处理模块、强制切分模块、切分可信度评估模块、错误处理模块、字幕生成模块。本发明专利技术能自动处理原始文本，分割为限定长度的句子或短语；采用形近词替代等方法自动处理非登录词，建立多发音注音网络；将注音网络展开为隐含马尔科夫识别语音对齐网络，使用强容错隐含马尔科夫声学模型对文本自动对齐强制切分；通过语音识别技术对每个切分段的切分结果进行可信度评估，可很容易发现切分错误以便进一步处理；直接根据切分结果生成各种格式适用于各种设备的视听字幕文件。借此，本发明专利技术可在无人工干预或很少人工干预的情况下直接得到高质量的视听字幕文件。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及外语电化教学领域，尤其涉及。
技术介绍
语言学习主要通过获得大量的可理解输入来实现，而“听”是获得可理解语言输入的最重要的渠道。中国的外语学习者面临着一个“读得懂却听不懂”的尴尬状态。基于多媒体技术的视听输入教学法，能再现人们真实交际场景，对改进外语教学起到了积极的推动作用。在视听输入教学法基础上，将话语信息以文字的形式(即视听字幕)同时呈现给受众，对外语视听教学更具有显著的积极意义。目前，有字幕加配的视听教学内容少之又少，其主要原因是当前字幕的加配主要是手工完成。专业技术人员需花费大量的时间和精力才能制作完成长度有限的字幕，成本太高而不能大规模应用。现代语音识别
中，在给定单句文本及其声音后，可以用基于隐含马尔科夫模型的核心模块将音节起止信息在音轴上显示出来。此方法主要应用于建立音节切分语音语料库，它要求文本与声音高度一致，否则就会切分失败或效果很差。而视听字幕的制作要求切分的单位是句子或短语，制作中要求方法有很高的容错性，要能处理文本中含未知发音的未登录词、多音词、含有错误文本段落等情况，要能发现指出切分错误之处，这些要求在传统方法中均无法满足。
技术实现思路
针对上述的缺陷，本专利技术的目的在于提供，其能够在无人工干预或很少人工干预的情况下直接得到高质量的用于外语电化教学的视听字幕文件。为了实现上述目的，本专利技术提供视听字幕制作系统，所述系统包括原始文本处理模块，用于将输入的原始文本分词后按指定规则分割为合适长度的句子或短语，并将所述句子或短语发送到注音模块；注音模块，用于处理所述句子或短语中的非登录词，然后通过查注音词典生成注音...

【技术保护点】
一种视听字幕制作系统，其特征在于，所述系统包括：原始文本处理模块，用于将输入的原始文本分词后按指定规则分割为合适长度的句子或短语，并将所述句子或短语发送到注音模块；注音模块，用于处理所述句子或短语中的非登录词，然后通过查注音词典生成注音网络，并将所述注音网络发送到强制切分模块；？原始声音处理模块，用于将输入的原始声音处理成预定要求的声音流，并将所述声音流发送到强制切分模块；强制切分模块，用于将所述注音网络切分为隐含马尔科夫识别语音的对齐网络，然后将所述声音流提取为特征流并在所述对齐网络对齐，并将切分结果输入到切分可信度评估模块；？切分可信度评估模块，用于通过语音识别对所述切分结果中每个切分段进行可信度评估得到切分可信度评估结果，若所述切分可信度评估结果达到预定值，则将所述切分结果直接发送到字幕生成模块，否则将所述切分可信度评估结果发送到错误处理模块；错误处理模块，用于显示所述切分可信度评估结果，判断是所述原始文本有误还是所述切分结果需要人工微调，若所述切分结果需要人工微调则人工微调所述切分结果并发送到字幕生成模块，若是所述原始文本有误则人工修改原始文本后重新交由所述原始文本处理模块切分...

【技术特征摘要】

【专利技术属性】
技术研发人员：张云梯，庄智象，黄卫，黄河，张中良，
申请(专利权)人：上海外教社信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人