优化上屏效果的语音识别方法、设备、终端与存储介质技术

技术编号：28747288 阅读：25 留言：0更新日期：2021-06-06 19:05

本发明专利技术涉及优化上屏效果的语音识别方法、设备、终端与存储介质，该方法包括：确定用于进行语音识别的引擎；对所述引擎进行调整；其中，所述调整包括：优化所述引擎的结构延时与时间片，以降低所述引擎的响应时间；和减小所述引擎中词典的颗粒度，以降低上屏内容的变化率；所述时间片为每次给所述引擎的数据量；基于调整后的所述引擎进行语音识别。本发明专利技术实施例的方案，从语音识别引擎角度出发，从引擎参数、模型结构、词典颗粒度等角度，提出了优化方法，能够降低引擎延时，并且出词更加平滑流畅，特别在上屏应用场景中，能够极大改善用户体验。能够极大改善用户体验。能够极大改善用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
优化上屏效果的语音识别方法、设备、终端与存储介质

[0001]本专利技术涉及上屏效果优化的
，具体涉及优化上屏效果的语音识别方法、设备、终端与存储介质。

技术介绍

[0002]在语音识别相关的上屏应用场景(如语音输入法、带屏类实时语音转写等)中，有很多因素会影响最终的上屏效果，如：识别引擎本身的准确率、实时率、识别引擎延时和网络延时等。其中，除去网络延时等外部因素，涉及到识别引擎本身的指标主要有：识别准确率、引擎延时和流畅度等，此外延时指标也会直接影响上屏效果的流畅度。
[0003]具体的，识别引擎各项性能都会直接影响最终的上屏效果；除了识别准确率直接影响用户体验之外，上屏的流畅度体验也是另一个非常重要的评价指标。
[0004]在目前的语音识别上屏场景中，经常出现虽然最终识别结果正确，但是主观感觉上屏显示效果不够流畅，会有“卡顿”(响应慢)、内容“跳变”(显示过程不平滑)等问题，严重影响用户的主观体验。
[0005]由此，目前需要有一种更好的方案来解决现有技术中的问题。
>
技术实现思路
...

【技术保护点】

【技术特征摘要】
1.一种优化上屏效果的语音识别方法，其特征在于，包括：确定用于进行语音识别的引擎；对所述引擎进行调整；其中，所述调整包括：优化所述引擎的结构延时与时间片，以降低所述引擎的响应时间；和减小所述引擎中词典的颗粒度，以降低上屏内容的变化率；所述时间片为每次给所述引擎的数据量；基于调整后的所述引擎进行语音识别。2.根据权利要求1所述的方法，其特征在于，优化所述引擎的结构延时，包括：在满足预设的语音识别率时，将所述引擎的右拼帧参数降低到最小。3.根据权利要求2所述的方法，其特征在于，所述右拼帧参数的范围为5
‑
25。4.如权利要求1所述的方法，其特征在于，优化所述引擎的时间片，包括：将所述引擎的时间片的大小设置为所述引擎的批处理大小。5.如权利要求4所述的方法，其特征在于，所述时间片的范围为20
‑
60ms。6.如权利要求1所述的方法，其特征在于，减小所述引擎中词典的颗粒度，包括以下一个或多个方式的任...

【专利技术属性】
技术研发人员：范红亮，李轶杰，梁家恩，
申请(专利权)人：厦门云知芯智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人