语音检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24760231 阅读:30 留言:0更新日期:2020-07-04 10:06
本申请公开了一种语音检测方法、装置、电子设备及存储介质,以满足现实场景中检查背诵或朗读正确性的需求,减轻检查者的工作量,同时还能够满足被查着进行自查的需求,提升查验效率。所述方法包括:获取针对参考文本的语音信号,并将语音信号转换为待检测文本;获取参考文本包含的关键词;将待检测文本和参考文本包含的关键词逐一进行匹配;根据匹配失败的关键词,输出参考文本中包含匹配失败的关键词的文本。

Voice detection method, device, electronic equipment and storage medium

The application discloses a voice detection method, device, electronic equipment and storage medium, so as to meet the requirements of checking the correctness of recitation or reading aloud in real scenes, reduce the workload of the examiner, and at the same time meet the self-examination needs of the inspected person, and improve the inspection efficiency. The method includes: acquiring the speech signal for the reference text and converting the speech signal into the text to be detected; obtaining the keywords contained in the reference text; matching the keywords contained in the text to be detected and the keywords contained in the reference text one by one; and outputting the text containing the keywords that failed to match in the reference text according to the keywords that fail to match.

【技术实现步骤摘要】
语音检测方法、装置、电子设备及存储介质
本申请涉及计算机
,尤其涉及一种语音检测方法、装置、电子设备及存储介质。
技术介绍
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。现实场景下背诵检查或朗读正确性检查一般由人工完成,但是人工检查容易受到背诵或朗读的文本长度、被检查者表述方式等因素影响。并且对于教师、家长等检查者而言,在检查大量背诵者或朗读者的过程中,保持专注度及一致的判罚尺度较为困难,同时比较耗费时间精力;而对于学生等被检查者而言,在没有另一个人作为检查者的情况下,只能对背诵的文本进行录音后,再充当检查者对录音进行检查,整体效率很低。
技术实现思路
针对上述技术问题,非常需要一种改进的方法,以满足现实场景中检查背诵或朗读正确性的需求,减轻检查者的工作量,同时还能够满足被查着进行自查的需求,提升查验效率。一方面,本申请一实施例提供了一种语音检测方法,包括:获取针对参考文本的语音信号,并将所述语音信号转换为待检测文本;获取本文档来自技高网...

【技术保护点】
1.一种语音检测方法,其特征在于,包括:/n获取针对参考文本的语音信号,并将所述语音信号转换为待检测文本;/n获取所述参考文本包含的关键词;/n将所述待检测文本和所述参考文本包含的关键词逐一进行匹配;/n根据匹配失败的关键词,输出所述参考文本中包含所述匹配失败的关键词的文本。/n

【技术特征摘要】
1.一种语音检测方法,其特征在于,包括:
获取针对参考文本的语音信号,并将所述语音信号转换为待检测文本;
获取所述参考文本包含的关键词;
将所述待检测文本和所述参考文本包含的关键词逐一进行匹配;
根据匹配失败的关键词,输出所述参考文本中包含所述匹配失败的关键词的文本。


2.根据权利要求1所述的方法,其特征在于,通过以下至少一种方式获取所述参考文本包含的关键词:
从所述参考文本中识别出命名实体,基于识别出的命名实体确定出所述参考文本包含的关键词;
根据预设词表从所述参考文本中提取出候选关键词,基于提取出的候选关键词确定出所述参考文本包含的关键词;
从所述参考文本中提取出满足预定义模板的文本,基于提取出的文本确定出所述参考文本包含的关键词;
基于已训练的关键词提取模型,确定出所述参考文本包含的关键词。


3.根据权利要求2所述的方法,其特征在于,所述基于提取出的候选关键词确定出所述参考文本包含的关键词,具体包括:
按提取出的候选关键词的词长度从小到大的顺序,依次将所述参考文本中的每个候选关键词的每个字符对应的标签设置为每个候选关键词唯一对应的标识符,其中,所述参考文本中的每个字符对应的标签的初始标识符为0;
将所述参考文本中连续且具有相同标签的至少一个字符合并成一个词;
将合并得到的词中标签不为0的词确定为所述参考文本包含的关键词。


4.根据权利要求2所述的方法,其特征在于,所述根据预设词表从所述参考文本中提取出候选关键词,具体包括:
从所述参考文本中提取出包含在预设词表中的预设词,并确定提取出的各个预设词的左侧字符和右侧字符在所述参考文本中的位置序号;
对所述参考文本进行分词处理,获得所述参考文本对应的若干分词片段以及第一分词边界集合和第二分词边界集合,所述第一分词边界集合包括各个分词片段的左侧字符在所述参考文本中的位置序号,所述第二分词边界...

【专利技术属性】
技术研发人员:刘阳邱硕付凯
申请(专利权)人:网易有道信息技术北京有限公司江苏分公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1