【技术实现步骤摘要】
音频数据的文本显示方法和装置
[0001]本专利技术涉及计算机信息
,尤其是涉及一种音频数据的文本显示方法和装置。
技术介绍
[0002]当用户需要了解通话内容时,看文本比听录音的效率要高很多,但是文本表达的信息可能与录音存在一定偏差。因而,相关技术中提供了一种展示通话录音内容的方法,该方法对通话录音进行自动语音识别,得到带角色和时间戳信息的文本,并将角色一次发话作为一个气泡,但得到的角色定位结果比较粗糙,如一次发话过程有较长的停顿,那么播放时停顿会以静音形式消耗时间;其次,角色一次发话内容较多时,一个气泡中内容会比较密集,阅读体验较差,比如出现看串行问题。
技术实现思路
[0003]本专利技术的目的在于提供一种音频数据的文本显示方法和装置,以解决听录音效率低,看文本丢失信息的问题。
[0004]第一方面,本专利技术提供一种音频数据的文本显示方法,该方法包括:如果获取到音频数据,对音频数据进行语音识别,得到文本数据;对文本数据进行预处理,得到多个文本片段;针对每个文本片段,按照预设文本长度和预设 ...
【技术保护点】
【技术特征摘要】
1.一种音频数据的文本显示方法,其特征在于,所述方法包括:如果获取到音频数据,对所述音频数据进行语音识别,得到文本数据;对所述文本数据进行预处理,得到多个文本片段;针对每个所述文本片段,按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到所述当前文本片段对应的至少一个子文本;对每个所述文本片段对应的子文本进行排序,并显示排序结果。2.根据权利要求1所述的方法,其特征在于,所述按照预设文本长度和预设时间间隔,对当前文本片段进行文本分割,得到所述当前文本片段对应的至少一个子文本的步骤,包括:根据所述当前文本片段所包含字符的长度和所述预设文本长度,确定所述当前文本片段分割后的子文本所包含的目标字符数量;基于所述当前文本片段对应的时间区间和所述预设时间间隔,确定所述当前文本片段分割后的子本文的目标时间长度;根据所述目标字符数量和所述目标时间长度,对所述当前文本片段进行分割,以将所述当前文本片段分割为至少一个子文本。3.根据权利要求2所述的方法,其特征在于,所述根据所述当前文本片段所包含字符的长度和所述预设文本长度,确定所述当前文本片段分割后的子文本所包含的目标字符数量的步骤,包括:对所述当前文本片段所包含字符的长度与所述预设文本长度相除的结果进行向上取整,得到第一数值;将所述第一数值确定为所述当前文本片段被分割为子文本的分割数量;将所述当前文本片段所包含字符的长度与所述第一数值相除的结果,确定为所述目标字符数量;所述基于所述当前文本片段对应的时间区间和所述预设时间间隔,确定所述当前文本片段分割后的子本文的目标时间长度的步骤,包括:对所述当前文本片段对应的时间区间与所述预设时间间隔相除的结果进行向上取整,得到第二数值;将所述第二数值确定为所述当前文本片段被分割为子文本的分割数量;将所述当前文本片段对应的时间区间与所述第二数值相除的结果,确定为所述目标时间长度。4.根据权利要求2所述的方法,其特征在于,每个所述文本片段所包含的字符均对应有时间戳;所述根据所述目标字符数量和所述目标时间长度,对所述当前文本片段进行分割,以将所述当前文本片段分割为至少一个子文本的步骤,包括:从所述当前文本片段中取出第一个字符;根据从所述当前文本片段中取出的字符,构建当前子文本;基于所述第一个字符对应的时间戳,确定所述当前子文本对应的字符长度和持续时长;如果所述字符长度小于所述目标字符数量且所述持续时长小于所述目标时间长度,从所述当前文本片段中取出所述第一个字符的下一个字符,将所述第一个字...
【专利技术属性】
技术研发人员:王建辉,杜新凯,吕超,史祎凡,崔术丰,吴岩,李根,
申请(专利权)人:阳光保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。