The invention provides a sample confirmation method and device and system, the method includes: obtaining the sample to be confirmed to be confirmed in each set of sample confidence; to determine the samples identified in each set to be confirmed similar samples for each sample to be confirmed; similar confidence is modified according to the samples, each stay confirm the sample confidence after correction; according to each pending confirmation of confidence for each sample to confirm the sample to be confirmed after correction. This method can improve the accuracy of sample confirmation and improve the application effect.
【技术实现步骤摘要】
样本确认方法和装置及系统
本申请涉及自然语言处理
,尤其涉及一种样本确认方法和装置及系统。
技术介绍
随着人工智能技术的日益成熟,越来越多的应用系统使用了人工智能相关技术,如关键词检索、身份认证、说话人分离、说话人性别确认等,都需要对候选样本进行最终的确认,以确认候选样本是否是目标样本,因此,样本确认的准确度直接影响最终的应用效果。相关技术中,一般直接根据待确认样本的置信度进行样本确认,具体确认时,设定置信度阈值,判断待确认样本的置信度是否超过预先设定的阈值,如果超过,则样本确认成功;否则,样本确认失败。上述方法在样本确认时,仅考虑了单一样本的信息,而待确认样本在实际应用中经常受环境或信道等外部因素的干扰,单一样本信息易发生改变,如果只考虑单一样本的信息,在样本确认时,常常会导致待确认样本被确认错误,即目标待确认样本被错误的确认为非目标样本或非目标待确认样本被错误的确认为目标样本,大大降低了样本确认的准确度,影响应用效果。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种样本确认方法,该方法可以提高样本确认的准确度,进而提高应用效果。本申请的另一个目的在于提出一种样本确认装置。本申请的另一个目的在于提出一种样本确认系统。为达到上述目的,本申请第一方面实施例提出的样本确认方法,包括:获取待确认样本集合中每个待确认样本的置信度;确定待确认样本集合中每个待确认样本的相似样本;根据所述相似样本对每个待确认样本的置信度进行修正,得到每个待确认样本的修正后的置信度;根据每个待确认样本的修正后的置信度对每个待确认 ...
【技术保护点】
一种样本确认方法,其特征在于,包括:获取待确认样本集合中每个待确认样本的置信度;确定待确认样本集合中每个待确认样本的相似样本;根据所述相似样本对每个待确认样本的置信度进行修正,得到每个待确认样本的修正后的置信度;根据每个待确认样本的修正后的置信度对每个待确认样本进行确认。
【技术特征摘要】
1.一种样本确认方法,其特征在于,包括:获取待确认样本集合中每个待确认样本的置信度;确定待确认样本集合中每个待确认样本的相似样本;根据所述相似样本对每个待确认样本的置信度进行修正,得到每个待确认样本的修正后的置信度;根据每个待确认样本的修正后的置信度对每个待确认样本进行确认。2.根据权利要求1所述的方法,其特征在于,所述确定待确认样本集合中每个待确认样本的相似样本,包括:计算待确认样本集合中每个待确认样本与其它待确认样本的相似度;根据每个待确认样本与其它待确认样本的相似度,确定每个待确认样本的相似样本。3.根据权利要求2所述的方法,其特征在于,所述根据每个待确认样本与其它待确认样本的相似度,确定每个待确认样本的相似样本,包括:对每个待确认样本与其它待确认样本的相似度进行规整,得到规整后的相似度;根据规整后的相似度,确定每个待确认样本的相似样本。4.根据权利要求3所述的方法,其特征在于,所述根据规整后的相似度,确定每个待确认样本的相似样本,包括:将大于预设阈值的规整后的相似度所对应的其它待确认样本,确定为每个待确认样本的相似样本;或者,对规整后的相似度按照从大到小的顺序排序,选择排序在前的预设个数的规整后的相似度,将选择的规整后的相似度所对应的其它待确认样本,确定为每个待确认的相似样本。5.根据权利要求1所述的方法,其特征在于,所述根据所述相似样本对每个待确认样本的置信度进行修正,得到每个待确认样本的修正后的置信度,包括:将每个待确认样本分别作为当前待确认样本,并对应当前待确认样本执行如下步骤:根据当前待确认样本与每个相似样本的规整后的相似度以及每个相似样本的置信度,计算当前待确认样本的所有相似样本的贡献率;对当前待确认样本的置信度和所述贡献率进行加权求和,得到当前待确认样本的修正后的置信度;其中,所述贡献率为当前待确认样本的所有相似样本的贡献度与当前待确认样本与所有相似样本的规整后的相似度和的比值,所述贡献度为当前待确认样本与每个相似样本的规整后的相似度与每个相似样本的置信度的乘积和。6.一种样本确认装置,其特征在于,包括:获取模块,用于获取待确认样本集合中每个待确认样本的置信度;确定模块,用于确定待确认样本集合中每个待确认样本的相似样本;修正模块,用于根据所述相似样本对每个待确认样本的置信度进行修正,得到每个待确认样本的...
【专利技术属性】
技术研发人员:方昕,刘俊华,魏思,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。