基于半自动校正的语音关键信息记录装置及方法制造方法及图纸

技术编号:8387587 阅读:243 留言:0更新日期:2013-03-07 08:16
一种语音识别技术领域的基于半自动校正的语音关键信息记录装置及方法,该装置包括:关键信息提取单元和与之相连的信息校正单元,其中:关键信息提取单元获取未经校正的文本信息并提取出关键信息后输出至信息校正单元,信息校正单元输出用户反馈确认后的文本信息。本发明专利技术通过半自动的信息校正单元,降低了人工校正的工作量;利用数据库对特殊名词如地名、专业工具名称进行校正,降低了人工校正中操作员的知识量限制所造成的影响;提取语音信息中的关键信息,从而提高所记录信息的有效信息量。

【技术实现步骤摘要】

本专利技术涉及的是一种语音识别
的装置及方法,具体是一种,通过对语音信号进行识别,并以文本形式进行记录,在用户不便对语音信息进行文字记录时,可替代用户完成语音信息的文字记录。
技术介绍
受限于语音信号识别技术,已知的记录装置在对收到的语音信号进行自动识别后,通过操作员的人工校正,以确保所记录信息的准确性。由此,使得记录装置的正常运作需要大量的人工校正工作;并且,语音信号中所提及的一些信息,可能由于操作员本身的知识量限制,无法做出有效地修正,比如一些地名或专业工具名称等。已知的记录装置,是对全部的语音信息进行识别记录。但是,语音信息中会出现大 量无意义的信息,比如通话过程中的问候语、助词、语气词。真实有效的信息通常仅为全部语音信息的一部分。识别并记录全部语音信息,一方面加大了文本信息校正的工作量;另一方面,用户也不需要诸如问候语之类的信息记录。语音信息记录,应尽可能精简,提供最多的有效信息量。经过对现有技术的检索发现,英国专利文献GB2323693A,记载了一种“Speech totext conversion”(语言文字转换系统),该技术包括至少一个用户终端用于录制语音,至少一个自动语音识别处理器以将录制的语音生成为文本,以及用于将文本反馈至终端的通讯装置;该用户终端与自动语音识别处理器之间通过服务器进行远程且选择性控制传输录制的语音文件。该技术还包括一选择纠正器,并由该技术的业务操作员对所识别出的文本信息进行纠错,最后将更正后的文本信息储存并反馈给用户。但是该现有技术需要业务操作员识别全部文本信息,且这些文本信息均为语音识别装置直接识别结果。一方面,全部文本信息中包含大量无意义信息,如通话过程中的问候语、助词、语气词,真实有效的信息仅占其中一部分,业务操作员识别全部文本信息加重了业务操作员的工作量。另一方面,语音识别装置直接识别结果中,一类信息为特殊名词、专有名词,由业务操作员负责对此类信息进行纠错,使得纠错的准确率依赖于业务员的知识量,存在错误纠错的风险;另一类信息,存在一定的格式上的要求,如时间信息,可通过算法进行自动纠错,若此类信息的纠错交由业务操作员,亦加重了业务操作员的纠错工作量。
技术实现思路
本专利技术针对现有技术存在的上述不足,提供一种,通过半自动的信息校正单元,降低了人工校正的工作量;利用数据库对特殊名词如地名、专业工具名称进行校正,降低了人工校正中操作员的知识量限制所造成的影响;提取语音信息中的关键信息,从而提高所记录信息的有效信息量。本专利技术是通过以下技术方案实现的本专利技术涉及一种基于半自动校正的语音关键信息记录装置,包括关键信息提取单元和与之相连的信息校正单元,其中关键信息提取单元获取未经校正的文本信息并提取出关键信息后输出至信息校正单元,信息校正单元输出用户反馈确认后的文本信息。所述的信息校正单元包括冗余信息校正模块、时间信息校正模块、特殊名词校正模块和用户反馈确认模块,其中冗余信息校正模块的输入端与关键信息提取单元相连,输出端与时间信息校正模块相连并将冗余信息校正后的关键信息传输给输出端;时间信息校正模块的输入端与冗余信息校正模块相连,输出端与特殊名词校正模块相连并将冗余信息校正、时间信息校正后的关键信息传递给输出端;特殊名词校正模块的输入端与时间信息校正模块相连,输出端与用户反馈确认模块相连并将冗余信息校正、时间信息校正、特殊名词校正后的关键信息传递给输出端。用户反馈确认模块的输入端与特殊名词校正模块相连并将冗余信息校正、时间信息校正、特殊名词校正后的关键信息经用户反馈确认后输出。所述的关键信息提取单元包括句法分析器模块和分类器模块,其中句法分析器模块的输入端与语音识别单元相连,输出端与分类器模块相连并将经句法分析后的词语、短语传输给输出端;分类器模块的输入端与句法分析器模块相连,输出端与信息校正单元相连并将分类后的信息中的关键信息传输给输出端。本专利技术涉及一种基于半自动校正的语音关键信息记录方法,包括以下步骤第一步,由用户处获得的语音信息通过语音识别软件获得语音信号所表达的未经校正的文本信息。所述的语音识别软件采用卡耐基梅隆大学的开源语音识别软件Sphinx进行自动语音识别。第二步,关键信息提取单元依次对未经校正的文本信息进行句法分析和分类分析得到时间信息、关键信息词类及特殊名词信息,并将上述信息作为关键信息传输至输出端。所述的句法分析是指对所获得的未经校正的文本信息采用句法分析器进行句法分析,实现对文本信息中语句的分词,从而将文本信息中的连续语句转化为各种词语和/或短语;所述的句法分析器采用斯坦福大学的开源句法分析器Stanford Parser进行句法分析。所述的分类分析是指对分类器采用汉语词性标注语料库进行训练后,采用分类器先从上述词语和/或短语中分类出时间信息及关键信息词类;此后再采用常用词库对分类器进行训练,并用分类器对关键信息词类中的名词部分,进一部分类获得常用词信息与非常用词信息;其中的非常用词信息即为特殊名词信息。所述的分类器采用贝叶斯文本分类器。所述的关键信息词类是指名词、动词、数词、形容词、副词、介词以及代词。所述的特殊名词信息是指名词中的非常用词信息部分。第三步,信息校正单元对关键信息依次进行冗余信息校正、时间信息校正以及特殊名词校正并最终得到校正后的关键信息,以消除语音识别过程中,由于口音以及识别单元自身性能影响所造成的识别误差,确保信息记录的准确性。所述的冗余信息校正是指I)计算任一两个关键信息A与B之间的编码距离d (A,B)权利要求1.一种基于半自动校正的语音关键信息记录装置,其特征在于,包括关键信息提取单元和与之相连的信息校正单元,其中关键信息提取单元获取未经校正的文本信息并提取出关键信息后输出至信息校正单元,信息校正单元输出用户反馈确认后的文本信息。2.根据权利要求I所述的基于半自动校正的语音关键信息记录装置,其特征是,所述的信息校正单元包括冗余信息校正模块、时间信息校正模块、特殊名词校正模块和用户反馈确认模块,其中冗余信息校正模块的输入端与关键信息提取单元相连,输出端与时间信息校正模块相连并将冗余信息校正后的关键信息传输给输出端;时间信息校正模块的输入端与冗余信息校正模块相连,输出端与特殊名词校正模块相连并将冗余信息校正、时间信息校正后的关键信息传递给输出端;特殊名词校正模块的输入端与时间信息校正模块相连,输出端与用户反馈确认模块相连并将冗余信息校正、时间信息校正、特殊名词校正后的关键信息传递给输出端。用户反馈确认模块的输入端与特殊名词校正模块相连并将冗余信息校正、时间信息校正、特殊名词校正后的关键信息经用户反馈确认后输出。3.根据权利要求I所述的基于半自动校正的语音关键信息记录装置,其特征是,所述 的关键信息提取单元包括句法分析器模块和分类器模块,其中句法分析器模块的输入端与语音识别单元相连,输出端与分类器模块相连并将经句法分析后的词语、短语传输给输出端;分类器模块的输入端与句法分析器模块相连,输出端与信息校正单元相连并将分类后的信息中的关键信息传输给输出端。4.一种基于半自动校正的语音关键信息记录方法,其特征在于,包括以下步骤 第一步,由用户处获得的语音信息通过语音识别软件获得语音信号所表达的未经校正的文本信息; 第二步本文档来自技高网
...

【技术保护点】
一种基于半自动校正的语音关键信息记录装置,其特征在于,包括:关键信息提取单元和与之相连的信息校正单元,其中:关键信息提取单元获取未经校正的文本信息并提取出关键信息后输出至信息校正单元,信息校正单元输出用户反馈确认后的文本信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:叶英孔吉刘佩林
申请(专利权)人:上海交通大学富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1