【技术实现步骤摘要】
实体识别方法、装置、计算机设备和存储介质
[0001]本申请涉及人工智能
,特别是涉及一种实体识别方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着语音识别技术的发展,出现了自动语音识别技术(Automatic Speech Recognition,简称ASR),ASR是一种将人的语音转换为文本的技术。ASR已被广泛应用于智能音响、智能手环、智能电视等智能设备,支持问答、语音控制等多种语音交互场景,通过将用户的语音转化为文字信息,解析并识别用户意图,然后给出相应的执行方案,最后输出符合用户意图的答案。
[0003]然而,对于专有名词场景(如人名识别),ASR的精准性并不理想,错误率高达50%以上。因此,如何提高在专有名词场景下,智能设备的语音识别的准确率成为目前亟待解决的问题。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高语音识别的准确率的实体识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面, ...
【技术保护点】
【技术特征摘要】
1.一种实体识别方法,其特征在于,所述方法包括:获取对目标语音进行识别得到的语音识别结果;根据语音识别结果中歧义实体的声学特征,计算所述歧义实体与图谱中各候选实体的相似度,得到图谱中各候选实体的第一相似度分数;图谱中的候选实体为与所述歧义实体相关的实体;根据所述第一相似度分数,从多个候选实体中确定出待确认集;根据预先配置的多个模板对所述待确认集中的各候选实体进行验证;所述模板根据所述图谱中的实体类型、实体属性和关系中的至少两种组合构建得到;根据验证通过的候选实体所对应的第一相似度分数,从所述候选实体中确定出目标实体以对所述歧义实体进行纠错。2.根据权利要求1所述的方法,其特征在于,所述根据语音识别结果中歧义实体的声学特征,计算所述歧义实体与图谱中各候选实体的相似度,得到图谱中各候选实体的第一相似度分数,包括:根据语音识别结果中歧义实体的声学特征,分别确定所述歧义实体的拼音组合和图谱中各候选实体的拼音组合;分别计算所述歧义实体的拼音组合与所述图谱中各候选实体的拼音组合的相似度,得到图谱中各候选实体的第一相似度分数。3.根据权利要求1所述的方法,其特征在于,所述根据预先配置的多个模板对所述待确认集中的各候选实体进行验证,包括:通过所述待确认集中的各候选实体分别替换所述语音识别结果中的所述歧义实体,得到替换结果;对每个替换结果分别进行分词,得到每个替换结果中的多个实体对象;对于每个替换结果,根据与每个替换结果分别对应的多个实体对象与所述图谱中各关联实体的相似度,确定每个替换结果的第二相似度分数;根据所述每个替换结果的第二相似度分数和预先配置的多个模板,对所述待确认集中的各候选实体进行验证。4.根据权利要求3所述的方法,其特征在于,所述根据所述每个替换结果的第二相似度分数和预先配置的多个模板,对所述待确认集中的各候选实体进行验证,包括:对于每个替换结果,分别与预先配置的多个模板进行匹配,得到每个替换结果的多个模板匹配分数;根据所述每个替换结果的第二相似度分数和多个模板匹配分数,得到每个替换结果的多个综合分数;根据每个替换结果的多个综合分数,对所述待确认集中与所述每个替换结果对应的候选实体进行验证。5.根据权利要求4所述的方法,其特征在于,所述根据每个替换结果的多个综合分数,对所述待确认集中与所述每个替换结果对应的候选实体进行验证,包括:对于各替换结果中的当前替换结果,从所述当前替换结果所对应的多个综合分数中确定出最大综合分数;获取与最大综合分数所对应...
【专利技术属性】
技术研发人员:敖建,孙雨辰,黄卫,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。