当前位置: 首页 > 专利查询>何宏山专利>正文

互联网语音分片速记方法技术

技术编号:3046238 阅读:205 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种互联网语音分片速记方法,包括步骤获取语音;对语音进行分片;发送分片给有请求的录入端;由录入端将分片录入为文字分片;整合所述语音所对应的所有文字分片为一文字整体。采用本发明专利技术互联网语音分片速记方法的技术方案可以避免“手指追赶语音”,从而提高速记准确度。

【技术实现步骤摘要】

本专利技术涉及语音速记领域,尤指一种避免“手指追赶语音”的。
技术介绍
速记指将人的语音信息转化为文字信息的过程。 人说话的速度一般在200-300字/分钟,有时可达到400字以上。速记的目的就是通过手指记录的方法,准确、完整地记录下人说话时的语音信息。 目前在实际使用中有两种速记方法。一是“手写速记”;二是“电脑速录”。 “手写速记”是一种采用特殊的书写符号记录语言的方法,在经过专门的训练后,速度可以达到100字左右,最快的速度也只能达到180字。“手写速记”无论是它的速度,还是面临当前文字电脑化的需求下,已经不能胜任速记的需要了。因此它已完全处于被淘汰的边缘了。 “电脑速录”是随着电子技术和计算机技术的发展而出现的,是采用计算机键盘或专用的“速记键盘”记录下听到的文字,使“手写速记”提升到了“电脑速录”的境界。应该说,现在已经进入到“电脑速录”的时代。目前仅就中文速录而言,最好的电脑速录的方法应该是“亚伟速录”。它是使用一种叫做“亚伟速录机”的特制键盘,在进行了专门培训后,速录员的速度可以达到150字以上/分钟。达到200字以上/分钟的有,但仍属少数。个别的最高速度虽然能达到400字以上/分钟,但那只是对所谓的熟文章的表演行为,而没有真正的实际意义。实用的速记速度应该是对生文章而言的。 由于录入员受到人体生理条件限制的缘故,能达到实用速度(生文章200字以上/分钟)的速录员仍然是少数,而且极难培养。从现在亚伟速录员培训的情况来看。大部分人的录入速度从不会到150字/分钟是比较容易的。一般周期为3-6个月。但从150字/分钟提速到200字以上/分钟,绝大部分人需要6个月或更长的时间。而要真正达到能独立完成速录的,有时往往需要一年以上,甚至几年时间的实践才能达到。这也是目前国内真正高水平的速录员仍很稀缺的主要原因,更是影响速记准确性的主要原因之一。 即使是能够达到实用速度的速录员,在实际的速记过程中。因为要长时间地录入,必然会出现身心的疲惫,或是遇到生疏的字词和打错字的时候,这时就肯定会出现跟不上讲话人的速度情况。此时,一般的速录员就不可避免地漏掉一些语音内容,无法完整地完成速记内容。即便是优秀的亚伟速录员也只能根据记忆的语音内容进行总结性地文字录入。无论是漏掉还是总结性的记录,这样的速记都不能称之为一个完整的速记。 无论是“手写速记”还是“电脑速录”,都没有摆脱依靠“手指追赶语音”的听音记录过程,受到人体生理条件和个人能力的限制的速记方法就必然难以达到真正意义上的和具有普遍的实际意义的速记。
技术实现思路
本专利技术要解决的问题是提供一种避免“手指追赶语音”的互联网语音分片速记方法。 为了解决上述问题,本专利技术互联网语音分片速记方法的技术方案包括 步骤10)获取语音; 步骤20)对语音进行分片; 步骤30)发送分片给有请求的录入端; 步骤40)由录入端将分片录入为文字分片; 步骤50)整合所述语音所对应的所有文字分片为一文字整体。 所述步骤20)又进一步分为步骤200)隔固定时间间隔对语音进行分片。 所述步骤200)之后还包括 步骤201)在分片的音频波形数据中的峰值点预分割所述分片为更小分片; 步骤202)逐个比较所述分片预分割成的更小分片; 步骤203)判断是否找到所述分片的分割点,所述分片的分割点指去噪平均值小于零且占空比最大的更小分片的中间点; 所述去噪平均值指所述更小分片的平均值减去所述分片平均值后的值; 所述更小分片平均值是波形在这个更小分片时间内的值; 所述分片平均值是整个待分割分片波形的平均值; 所述占空比指所述更小分片在所述分片中所占的时间比值; 若未找到所述分片的分割点,步骤204)将所述分片与下一个分片合并为一个分片,重复执行步骤201); 若找到所述分片的分割点,步骤205)在所述分片的分割点分割所述分片; 步骤206)将分片中分割点前的部分存入分片音频缓冲区,所述分片音频缓冲区用于存放已分割好的分片; 步骤207)将分片中分割点后的部分与下一个分片合并为一个分片,重复执行步骤201)。 所述步骤206)后还包括步骤206a)为存入分片音频缓冲区中的每一个分片设置用于标识该分片的分片控制信息。 所述步骤206a)中的所述分片控制信息包括下列字段 客户号,用于表示语音信息被速记的一方; 速记号,用于语音信息被速记的一方的语音信息的编号; 序号,用于表示所述分片的编号; 时码,用于表示所述分片在整个语音信息中的时间位置; 时长,用于表示所述分片的时间; 状态,用于表示所述分片录为文字分片的情况。 所述步骤40)后还包括步骤41)若录入端无法录入该分片,将所述分片的分片控制信息的状态字段置为未被识别,并将该分片回传至问题分片数据库表中,所述问题分片数据库表用于存放分片控制信息的状态字段为未被识别的分片。 所述步骤200)中的所述固定时间间隔为5秒。 与现有技术相比,本专利技术互联网语音分片速记方法的有益效果为 首先,由于本专利技术互联网语音分片速记方法采用对语音进行分片,将分片发给有请求的录入端,也就是说,当录入端把当前分片录入完后,其请求下一个分片,才被分配下一个分片,从而避免了“手指追赶语音”的听音记录过程,并且一段语音可分配给多个录入端录入,从而可使得速记过程不受人体生理条件(如疲劳等)的限制。 其次,由于采用在分片的分割点对分片进一步分割,且分片分割点的确定采用的是动态离散聚类平均值的方法,使得经过分割后得到的分片正好是通常人们讲话的间歇点范围,即通常的有逗号或句号的地方,从而避免录入端听到半截话,因此有利于提高录入的准确度。 再者,在需录入的语音中,可能会出现如方言、外语或者录入端不懂的技术术语等,使得录入端无法完成该分片的录入,本专利技术互联网语音分片速记方法采用将录入端无法完成的分片标记为“未被识别”状态并回传入问题分片数据库中,将存放在问题分片数据库中的问题分片分配给其它录入端录入,从而大大提高了录入的准确度,避免录入端胡乱猜测。 然后,由于连续语音被分解成小的“语音分片”,它的长度一般被控制在1.5-10秒之间。经过压缩处理后,它的数据大小一般只有几K到十几K字节。这样大小的数据符合互联网传输的特点。因为如果数据太大的话,容易受到互联网传输阻塞的影响。这些小数据量的“语音分片”可以在互联网上被有效地实时传输。因此可以做到,分割一片,传送一片,控制分发一片。在录入端可以及时地录入一片“语音分片”,在客户端又可以及时地回收到一片“文字分片”。这种连续的语音流不断被分割和录入一片一片的推进过程,“文字分片”和“语音分片”可以保持在一个准同步的状态。即文字内容对应语音内容只有一个几秒到十几秒的滞后。因此将整段语音内容录入完成为文字交给客户的时间就是最后一个“文字分片”返回的时间。那么最后一个语音分片从分发、传送,到最后一个文字分片录入、回传的过程一般可以控制在1分钟之内。其实在这个过程中文字录入的时间是最长的,一般是语音分片长度的2-3倍(一般的录入员水平)。即按语音长度为5秒计算,录入用的时间最长为15秒。在这里,因为文字分片的数据长度很小,即便是加上各种控制参数也不过2本文档来自技高网
...

【技术保护点】
一种互联网语音分片速记方法,其特征在于,包括:步骤10)获取语音;步骤20)对语音进行分片;步骤30)发送分片给有请求的录入端;步骤40)由录入端将分片录入为文字分片;步骤50)整合所述语音所对应的所 有文字分片为一文字整体。

【技术特征摘要】
1、一种互联网语音分片速记方法,其特征在于,包括步骤10)获取语音;步骤20)对语音进行分片;步骤30)发送分片给有请求的录入端;步骤40)由录入端将分片录入为文字分片;步骤50)整合所述语音所对应的所有文字分片为一文字整体。2、如权利要求1所述的互联网语音分片速记方法,其特征在于,所述步骤20)又进一步分为步骤200)隔固定时间间隔对语音进行分片。3、如权利要求2所述的互联网语音分片速记方法,其特征在于,所述步骤200)之后还包括步骤201)在分片的音频波形数据中的峰值点预分割所述分片为更小分片;步骤202)逐个比较所述分片预分割成的更小分片;步骤203)判断是否找到所述分片的分割点,所述分片的分割点指去噪平均值小于零且占空比最大的更小分片的中间点;所述去噪平均值指所述更小分片的平均值减去所述分片平均值后的值;所述更小分片平均值是波形在这个更小分片时间内的值;所述分片平均值是整个待分割分片波形的平均值;所述占空比指所述更小分片在所述分片中所占的时间比值;若未找到所述分片的分割点,步骤204)将所述分片与下一个分片合并为一个分片,重复执行步骤201);若找到所述分片的分割点,步骤205)在所述分片的分割点分割所述分片;步骤206)将分片...

【专利技术属性】
技术研发人员:何宏山
申请(专利权)人:何宏山
类型:发明
国别省市:87[中国|西安]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利