一种用于会议速记的人机协同编辑方法技术

技术编号：22167206 阅读：50 留言：0更新日期：2019-09-21 10:42

本发明专利技术公开了一种用于会议速记的人机协同编辑方法，包括以下步骤：1.会议速记终端按照自然句对音频流进行切割，并将音频段发送至第三方服务器，第三方服务器将音频段转换为与其对应的文本；2.会议速记终端在切割音频流时，对每一音频段的开始时间、结束时间、音频代码进行记录，并结合第三方服务器返回的该音频段对应的文本生成日志文件；3.会议速记终端将音频段、文本和日志文件发送至协同编辑服务器；4.协同编辑服务器根据日志文件将音频段和文本进行一一对应；5.人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。本发明专利技术能够简单方便地根据会议音频对动态生成的会议记录的实时修正。

A Man-Machine Cooperative Editing Method for Conference Stenography

全部详细技术资料下载

【技术实现步骤摘要】
一种用于会议速记的人机协同编辑方法
本专利技术涉及语音速记
，尤其是一种用于会议速记的人机协同编辑方法。
技术介绍
在会议过程中，由记录人员把会议的组织情况和具体内容记录下来，就形成了会议记录。最传统的形式是由记录人员现场速记并在会议结束之后根据会议录音整理核对会议记录。随着语音识别技术（ASR）和自然语言处理技术（NLP）的发展，会议中产生的音频能够在会议现场直接实时转换成文字并生成会议记录，极大地减少了记录人员的工作量。语音识别技术是将人类语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列；自然语言处理技术研究的是如何实现人与计算机之间用自然语言进行有效通信；两者相结合，就能够将人类语音转换为人类语言的书面表达形式——文本。但是，这个转换过程不能保证百分百精准，尤其对于一些没有录入系统中的术语、人物姓名等，系统没有办法判断具体应该是何字。例如输入语音“章子怡”，系统对于这个明星的姓名能够予以识别并转换成正确的文字；输入语音“张二雷”，对于这个陌生的词组，系统只能逐字音译并选择系统设置的默认选项，如系统默认“zhang”优先“章”时，语音“张二雷”可能就会被转换成文字“章二雷”，这就导致了错误的存在。当然，实际的错误不仅限于此。现有的用于会议速记的人机协同编辑方法的准确率基本在90-95%左右，对于文本中存在的错误，有必要进行修正。目前，采用的修正方式，主要还是会议结束之后，记录人员根据会议录音对会议记录进行整理核对，使得会议记录成稿的生成存在一定的延时性，存在一定的不便之处。随之容易想到的，最优的修正方式，当然是对音频转换而...

【技术保护点】
1.一种用于会议速记的人机协同编辑方法，其特征在于，包括以下步骤：步骤1，会议进行时，会议速记终端按照自然句对音频流进行切割形成音频段，并将音频段发送至第三方服务器，第三方服务器通过语音识别技术和自然语言处理技术将音频段转换为与其对应的文本；步骤2，会议速记终端在切割音频流时，对每一音频段的开始时间、结束时间、音频代码进行记录，并结合第三方服务器返回的该音频段对应的文本生成日志文件；步骤3，会议速记终端将音频段、文本和日志文件发送至协同编辑服务器；步骤4，协同编辑服务器根据日志文件将音频段和文本进行一一对应；步骤5，人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。

【技术特征摘要】
1.一种用于会议速记的人机协同编辑方法，其特征在于，包括以下步骤：步骤1，会议进行时，会议速记终端按照自然句对音频流进行切割形成音频段，并将音频段发送至第三方服务器，第三方服务器通过语音识别技术和自然语言处理技术将音频段转换为与其对应的文本；步骤2，会议速记终端在切割音频流时，对每一音频段的开始时间、结束时间、音频代码进行记录，并结合第三方服务器返回的该音频段对应的文本生成日志文件；步骤3，会议速记终端将音频段、文本和日志文件发送至协同编辑服务器；步骤4，协同编辑服务器根据日志文件将音频段和文本进行一一对应；步骤5，人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。2.根据权利要求1所述的人机协同编辑方法，其特征在于，第三方服务器包括ASR服务器和NLP服务器。3.根据权利要求1或2所述的人机协同编辑方法，其特征在于，音频段时长限制在60s以内，切割音频段之间的...

【专利技术属性】
技术研发人员：虞焰兴，徐勇，
申请(专利权)人：安徽声讯信息技术有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人