一种基于热词的会议语音识别方法技术

技术编号：32513219 阅读：19 留言：0更新日期：2022-03-02 11:02

本申请公开了一种基于热词的会议语音识别方法。本方法包括：获取第一音频的第一识别结果，第一识别结果是对第一音频进行音频识别得到的，第一识别结果包括表征第一音频的内容的词汇；获取对第一识别结果进行修正而得到的第一修正结果；将包含于第一修正结果并且不包含于第一识别结果的词汇确定为至少一个热词；基于至少一个热词，获取第二音频的第二识别结果。在本方法中，在对第一识别结果进行修正后，电子设备将第一修正结果中包含但第一识别结果中不包含的词汇确定为热词。因此在后续的音频识别中，即使电子设备不能准确识别某些技术名词，也能基于热词提高对上述未识别到的技术名词的识别概率，增加音频识别的准确性。增加音频识别的准确性。增加音频识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于热词的会议语音识别方法

[0001]本申请涉及音频识别
，更具体地，涉及一种基于热词的会议语音识别方法。

技术介绍

[0002]实时会议音频识别技术，是一种通过语音识别模型将会议音频信息实时转换成文字信息的技术。在实时会议音频的识别过程中，语音识别模型会因为对热词(比如
的专有名词)缺少对应的模型训练，导致无法对热词进行识别，从而导致在学术会议或者专业性较强的会议中，实时会议音频识别的效果较差。
[0003]针对上述问题，目前的解决方法为在会议之前，通过人工去配置需要识别的热词，工作人员需要针对不同领域的技术会议配置不同
的热词，这就导致了需要花费较大的人工成本和时间成本。

技术实现思路

[0004]本申请一些实施例提供一种基于热词的会议语音识别方法，该方法包括：获取第一音频的第一识别结果，第一识别结果是对第一音频进行音频识别得到的，第一识别结果包括表征第一音频的内容的词汇；获取对第一识别结果进行修正而得到的第一修正结果；将包含于第一修正结果并且不包含于第一识别结果的词汇确定为至少一个热词；基于至少一个热词，获取第二音频的第二识别结果。
[0005]本申请实施例提供的一种基于热词的会议语音识别方法，通过获取第一音频的第一识别结果，第一识别结果是对第一音频进行音频识别得到的，第一识别结果包括表征第一音频的内容的词汇；获取对第一识别结果进行修正而得到的第一修正结果；将包含于第一修正结果并且不包含于第一识别结果的词汇确定为至少一个热词；基于至少一个热词，获取第二音频...

【技术保护点】

【技术特征摘要】
1.一种基于热词的会议语音识别方法，其特征在于，所述方法包括：获取第一音频的第一识别结果，所述第一识别结果是对所述第一音频进行音频识别得到的，所述第一识别结果包括表征所述第一音频的内容的词汇；获取对所述第一识别结果进行修正而得到的第一修正结果；将包含于所述第一修正结果并且不包含于所述第一识别结果的词汇确定为至少一个热词；基于至少一个所述热词，获取第二音频的第二识别结果。2.根据权利要求1所述的方法，其特征在于，所述将包含于所述第一修正结果并且不包含于所述第一识别结果的词汇确定为至少一个热词，包括：对所述第一识别结果进行第一分词操作，获取第一分词结果；对所述第一修正结果进行第二分词操作，获取第二分词结果；将包含于所述第二分词结果并且不包含于所述第一分词结果的词汇确定为至少一个所述热词。3.根据权利要求2所述的方法，其特征在于，所述将包含于所述第二分词结果并且不包含于所述第一分词结果的词汇确定为至少一个所述热词之前，还包括：获取所述第一识别结果对应的第一文本向量和所述第一修正结果对应的第二文本向量；若所述第一文本向量和所述第二文本向量之间的相似度大于或等于预设相似度，则执行所述将包含于所述第二分词结果并且不包含于所述第一分词结果的词汇确定为至少一个所述热词的步骤。4.根据权利要求3所述的方法，其特征在于，所述获取所述第一识别结果对应的第一文本向量和所述第一修正结果对应的第二文本向量，包括：计算所述第一识别结果对应的第一分词结果和所述第一修正结果对应的第二分词结果的并集；统计所述第一分词结果中的每个词汇在所述并集中出现的次数，得到所述第一文本向量；统计所述第二分词结果中的每个词汇在所述并集中出现的次数，得到所述第二文本向量。5.根据权利要求1所述的方法，其特征在于，所述基于至少一个所述热词，获取第二音频的第二识别结果，包括：基于预设词表对所述第二音频进行音频识别，得到所述第二音频的至少一个候选识别结果；基于至少一个所述热词，在至少一个所述候选识别结果中确定所述第二音频的第二识别结果。6.根据权利要求5所述的方法，其特征在于，所述基于至少一个所述热词，在至少一个所述候选识别结果中确定所述第二音频的第二识别结果，包括：基于至少一个所述...

【专利技术属性】
技术研发人员：郑颖龙，吴广财，赖蔚蔚，周昉昉，陈颖璇，林嘉鑫，叶杭，郑杰生，李凯，曾朝霖，许鑫禹，
申请(专利权)人：广东电力信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人