语音转写方法、装置、录音笔和存储介质制造方法及图纸

技术编号:27845678 阅读:18 留言:0更新日期:2021-03-30 12:51
本发明专利技术实施例提供一种语音转写方法、装置、录音笔和存储介质,该方法包括:采集语音数据,并对语音数据进行实时语音转写,得到语音数据的实时离线转写文本;将语音数据上传至服务器,以供服务器在语音数据采集结束后对语音数据的整体进行语音转写,并接收服务器下发的在线转写文本;将实时离线转写文本替换为在线转写文本。本发明专利技术实施例提供的语音转写方法、装置、录音笔和存储介质,结合离线转写和在线转写,既保证了语音转写的实时性,又保证了语音转写的准确性,实现了语音转写的实时性和准确性的兼容。确性的兼容。确性的兼容。

【技术实现步骤摘要】
语音转写方法、装置、录音笔和存储介质


[0001]本专利技术涉及语音处理
,尤其涉及一种语音转写方法、装置、录音笔和存储介质。

技术介绍

[0002]录音笔凭借携带方便、操作简单等优点,被广泛应用于会议、演讲记录、采访和课堂等场合。
[0003]然而,目前市面上的主流录音笔只具备录音功能,录音完成后需要人工将录制的音频数据转换为文字,或是将音频数据上传到云端服务器进行转写,操作复杂、灵活性较差,而且在录音过程中,无法对音频数据进行转写,实时性较差。

技术实现思路

[0004]本专利技术实施例提供一种语音转写方法、装置、录音笔和存储介质,用以解决现有技术中操作复杂、灵活性较差以及实时性较差的缺陷。
[0005]本专利技术实施例提供一种语音转写方法,包括:
[0006]采集语音数据,并对所述语音数据进行实时语音转写,得到所述语音数据的实时离线转写文本;
[0007]将所述语音数据上传至服务器,以供所述服务器在所述语音数据采集结束后对所述语音数据的整体进行语音转写,并接收所述服务器下发的在线转写文本;
[0008]将所述实时离线转写文本替换为所述在线转写文本。
[0009]根据本专利技术一个实施例的语音转写方法,所述将所述语音数据上传至服务器,包括:
[0010]基于当前网络状态,确定语音数据传输方式,所述语音数据传输方式为整体上传或分片段上传;
[0011]基于所述语音数据传输方式,将所述语音数据上传至服务器。
[0012]根据本专利技术一个实施例的语音转写方法,所述基于所述语音数据传输方式,将所述语音数据上传至服务器,包括:
[0013]若所述语音数据传输方式为整体上传且所述语音数据采集结束,则将所述语音数据的整体上传至所述服务器;
[0014]若所述语音数据传输方式为分片段上传,则每隔预设时间间隔,将最新采集的所述语音数据的片段上传至所述服务器。
[0015]根据本专利技术一个实施例的语音转写方法,所述每隔预设时间间隔,将最新采集的所述语音数据的片段上传至所述服务器,之后还包括:
[0016]若所述语音数据采集结束,则将最新采集的所述语音数据的片段以及采集结束标识上传至所述服务器,以供所述服务器在接收到所述采集结束标识后将接收到的所有片段合并为所述语音数据。
[0017]根据本专利技术一个实施例的语音转写方法,所述将所述语音数据上传至服务器,以供所述服务器在所述语音数据采集结束后对所述语音数据的整体进行语音转写,包括:
[0018]将所述语音数据,以及所述语音数据的领域信息上传至所述服务器,以供所述服务器在所述语音数据采集结束后基于所述领域信息对所述语音数据的整体进行语音转写。
[0019]根据本专利技术一个实施例的语音转写方法,所述对所述语音数据进行实时语音转写,包括:
[0020]基于设备能耗状态和/或所述语音数据的噪声水平,确定实时语音转写模式;
[0021]基于所述实时语音转写模式,对所述语音数据进行实时语音转写。
[0022]根据本专利技术一个实施例的语音转写方法,所述将所述语音数据上传至服务器,之前还包括:
[0023]基于当前网络状态,确定上传语音数据所需的编码格式;
[0024]基于所述编码格式,对所述语音数据进行编码。
[0025]本专利技术实施例还提供一种语音转写装置,包括:
[0026]实时语音转写单元,用于采集语音数据,并对所述语音数据进行实时语音转写,得到所述语音数据的实时离线转写文本;
[0027]数据交互单元,用于将所述语音数据上传至服务器,以供所述服务器在所述语音数据采集结束后对所述语音数据的整体进行语音转写,并接收所述服务器下发的在线转写文本;
[0028]文本替换单元,用于将所述实时离线转写文本替换为所述在线转写文本。
[0029]本专利技术实施例还提供一种录音笔,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音转写方法的步骤。
[0030]本专利技术实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音转写方法的步骤。
[0031]本专利技术实施例提供的一种语音转写方法、装置、录音笔和存储介质,通过对语音数据进行实时语音转写,得到语音数据的实时离线转写文本,并将语音数据上传至服务器进行在线转写,将实时离线转写文本替换为在线转写文本,结合离线转写和在线转写,既保证了语音转写的实时性,又保证了语音转写的准确性,实现了语音转写的实时性和准确性的兼容。
附图说明
[0032]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本专利技术实施例提供的语音转写方法的流程示意图;
[0034]图2为本专利技术实施例提供的语音数据上传方法的流程示意图;
[0035]图3为本专利技术实施例提供的麦克风的结构示意图;
[0036]图4为本专利技术实施例提供的语音转写装置的结构示意图;
[0037]图5是本专利技术实施例提供的录音笔的结构示意图。
具体实施方式
[0038]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0039]录音笔凭借携带方便、操作简单等优点,被广泛应用于会议、演讲记录、采访和课堂等场合。
[0040]然而,目前市面上的主流录音笔只具备录音功能,若需要获取录制音频数据的文本,则需要人工将音频数据转换为文字,效率低下,而且重复工作量大。此外,也可以把录音文件导出后,将音频数据上传到云端服务器,依托网络引擎进行转写,但这种转写方式较为固定,灵活性较差,而且上述两种转写方式均无法在录音过程中对音频数据进行转写,实时性较差。
[0041]对此,本专利技术实施例提供了一种语音转写方法,本专利技术实施例提供的语音转写方法可以应用于智能录音笔,也可以应用于具有录音功能的其他智能设备,例如智能手机、平板电脑等,图1为本专利技术实施例提供的语音转写方法的流程示意图,如图1所示,该方法包括:
[0042]步骤110,采集语音数据,并对语音数据进行实时语音转写,得到语音数据的实时离线转写文本。
[0043]具体地,智能设备的语音采集模块在采集语音数据的同时,基于智能设备内置的离线转写模块对语音数据进行实时语音转写,得到语音数据的实时离线转写文本。其中,语音数据的实时离本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音转写方法,其特征在于,包括:采集语音数据,并对所述语音数据进行实时语音转写,得到所述语音数据的实时离线转写文本;将所述语音数据上传至服务器,以供所述服务器在所述语音数据采集结束后对所述语音数据的整体进行语音转写,并接收所述服务器下发的在线转写文本;将所述实时离线转写文本替换为所述在线转写文本。2.根据权利要求1所述的语音转写方法,其特征在于,所述将所述语音数据上传至服务器,包括:基于当前网络状态,确定语音数据传输方式,所述语音数据传输方式为整体上传或分片段上传;基于所述语音数据传输方式,将所述语音数据上传至服务器。3.根据权利要求2所述的语音转写方法,其特征在于,所述基于所述语音数据传输方式,将所述语音数据上传至服务器,包括:若所述语音数据传输方式为整体上传且所述语音数据采集结束,则将所述语音数据的整体上传至所述服务器;若所述语音数据传输方式为分片段上传,则每隔预设时间间隔,将最新采集的所述语音数据的片段上传至所述服务器。4.根据权利要求3所述的语音转写方法,其特征在于,所述每隔预设时间间隔,将最新采集的所述语音数据的片段上传至所述服务器,之后还包括:若所述语音数据采集结束,则将最新采集的所述语音数据的片段以及采集结束标识上传至所述服务器,以供所述服务器在接收到所述采集结束标识后将接收到的所有片段合并为所述语音数据。5.根据权利要求1

4任一项所述的语音转写方法,其特征在于,所述将所述语音数据上传至服务器,以供所述服务器在所述语音数据采集结束后对所述语音数据的整体进行语音转写,...

【专利技术属性】
技术研发人员:王志军李传刚
申请(专利权)人:天津讯飞极智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1