优化上屏效果的语音识别方法、设备、终端与存储介质技术

技术编号:28747288 阅读:25 留言:0更新日期:2021-06-06 19:05
本发明专利技术涉及优化上屏效果的语音识别方法、设备、终端与存储介质,该方法包括:确定用于进行语音识别的引擎;对所述引擎进行调整;其中,所述调整包括:优化所述引擎的结构延时与时间片,以降低所述引擎的响应时间;和减小所述引擎中词典的颗粒度,以降低上屏内容的变化率;所述时间片为每次给所述引擎的数据量;基于调整后的所述引擎进行语音识别。本发明专利技术实施例的方案,从语音识别引擎角度出发,从引擎参数、模型结构、词典颗粒度等角度,提出了优化方法,能够降低引擎延时,并且出词更加平滑流畅,特别在上屏应用场景中,能够极大改善用户体验。能够极大改善用户体验。能够极大改善用户体验。

【技术实现步骤摘要】
优化上屏效果的语音识别方法、设备、终端与存储介质


[0001]本专利技术涉及上屏效果优化的
,具体涉及优化上屏效果的语音识 别方法、设备、终端与存储介质。

技术介绍

[0002]在语音识别相关的上屏应用场景(如语音输入法、带屏类实时语音转写 等)中,有很多因素会影响最终的上屏效果,如:识别引擎本身的准确率、 实时率、识别引擎延时和网络延时等。其中,除去网络延时等外部因素,涉 及到识别引擎本身的指标主要有:识别准确率、引擎延时和流畅度等,此外 延时指标也会直接影响上屏效果的流畅度。
[0003]具体的,识别引擎各项性能都会直接影响最终的上屏效果;除了识别准 确率直接影响用户体验之外,上屏的流畅度体验也是另一个非常重要的评价 指标。
[0004]在目前的语音识别上屏场景中,经常出现虽然最终识别结果正确,但是 主观感觉上屏显示效果不够流畅,会有“卡顿”(响应慢)、内容“跳变”(显 示过程不平滑)等问题,严重影响用户的主观体验。
[0005]由此,目前需要有一种更好的方案来解决现有技术中的问题。
>
技术实现思路
...

【技术保护点】

【技术特征摘要】
1.一种优化上屏效果的语音识别方法,其特征在于,包括:确定用于进行语音识别的引擎;对所述引擎进行调整;其中,所述调整包括:优化所述引擎的结构延时与时间片,以降低所述引擎的响应时间;和减小所述引擎中词典的颗粒度,以降低上屏内容的变化率;所述时间片为每次给所述引擎的数据量;基于调整后的所述引擎进行语音识别。2.根据权利要求1所述的方法,其特征在于,优化所述引擎的结构延时,包括:在满足预设的语音识别率时,将所述引擎的右拼帧参数降低到最小。3.根据权利要求2所述的方法,其特征在于,所述右拼帧参数的范围为5

25。4.如权利要求1所述的方法,其特征在于,优化所述引擎的时间片,包括:将所述引擎的时间片的大小设置为所述引擎的批处理大小。5.如权利要求4所述的方法,其特征在于,所述时间片的范围为20

60ms。6.如权利要求1所述的方法,其特征在于,减小所述引擎中词典的颗粒度,包括以下一个或多个方式的任...

【专利技术属性】
技术研发人员:范红亮李轶杰梁家恩
申请(专利权)人:厦门云知芯智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1