【技术实现步骤摘要】
优化上屏效果的语音识别方法、设备、终端与存储介质
[0001]本专利技术涉及上屏效果优化的
,具体涉及优化上屏效果的语音识 别方法、设备、终端与存储介质。
技术介绍
[0002]在语音识别相关的上屏应用场景(如语音输入法、带屏类实时语音转写 等)中,有很多因素会影响最终的上屏效果,如:识别引擎本身的准确率、 实时率、识别引擎延时和网络延时等。其中,除去网络延时等外部因素,涉 及到识别引擎本身的指标主要有:识别准确率、引擎延时和流畅度等,此外 延时指标也会直接影响上屏效果的流畅度。
[0003]具体的,识别引擎各项性能都会直接影响最终的上屏效果;除了识别准 确率直接影响用户体验之外,上屏的流畅度体验也是另一个非常重要的评价 指标。
[0004]在目前的语音识别上屏场景中,经常出现虽然最终识别结果正确,但是 主观感觉上屏显示效果不够流畅,会有“卡顿”(响应慢)、内容“跳变”(显 示过程不平滑)等问题,严重影响用户的主观体验。
[0005]由此,目前需要有一种更好的方案来解决现有技术中的问题。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种优化上屏效果的语音识别方法,其特征在于,包括:确定用于进行语音识别的引擎;对所述引擎进行调整;其中,所述调整包括:优化所述引擎的结构延时与时间片,以降低所述引擎的响应时间;和减小所述引擎中词典的颗粒度,以降低上屏内容的变化率;所述时间片为每次给所述引擎的数据量;基于调整后的所述引擎进行语音识别。2.根据权利要求1所述的方法,其特征在于,优化所述引擎的结构延时,包括:在满足预设的语音识别率时,将所述引擎的右拼帧参数降低到最小。3.根据权利要求2所述的方法,其特征在于,所述右拼帧参数的范围为5
‑
25。4.如权利要求1所述的方法,其特征在于,优化所述引擎的时间片,包括:将所述引擎的时间片的大小设置为所述引擎的批处理大小。5.如权利要求4所述的方法,其特征在于,所述时间片的范围为20
‑
60ms。6.如权利要求1所述的方法,其特征在于,减小所述引擎中词典的颗粒度,包括以下一个或多个方式的任...
【专利技术属性】
技术研发人员:范红亮,李轶杰,梁家恩,
申请(专利权)人:厦门云知芯智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。