【技术实现步骤摘要】
一种分类模糊性分析方法及装置
本专利技术涉及信息处理
,尤其涉及一种分类模糊性分析方法及装置。
技术介绍
随着深度学习和机器学习在语义识别和图像分类等的广泛应用,对智能系统的优化成为主要研究方向。其中,知识库为智能系统的重要组成部分,其性能往往会较大的影响智能系统的性能。以问答系统(例如,客服机器人)为例,一个问答系统的知识库中语料的分类的准确性往往会较大的影响问答系统的准确性。目前,通常是基于人工依据经验分析知识库分类的模糊性,这种方式不但较为耗费时间,且分析结果的准确性严重依赖于分析人员的经验水平,主观性较强,可靠性较差。
技术实现思路
本专利技术实施例提供一种分类模糊性分析方法及装置,以解决现有技术中知识库分类的模糊性分析结果的可靠性较差的问题。为了解决上述技术问题,本专利技术是这样实现的:第一方面,本专利技术实施例提供了一种分类模糊性分析方法。该方法包括:从知识库筛选待标注的N条语料;N为大于1的整数;分别接收针对所述N条语料中每条语料的M个分类标注;M为大于 ...
【技术保护点】
1.一种分类模糊性分析方法,其特征在于,包括:/n从知识库筛选待标注的N条语料;N为大于1的整数;/n分别接收针对所述N条语料中每条语料的M个分类标注;M为大于1的整数;/n分别将所述每条语料的M个分类标注中每两个分类标注组成分类标注对;/n分别确定每个所述分类标注对的第一模糊相关系数;/n根据全部所述分类标注对的第一模糊相关系数,计算K个分类中的每个分类的模糊性指标;所述K个分类根据全部所述分类标注确定,K为正整数。/n
【技术特征摘要】
1.一种分类模糊性分析方法,其特征在于,包括:
从知识库筛选待标注的N条语料;N为大于1的整数;
分别接收针对所述N条语料中每条语料的M个分类标注;M为大于1的整数;
分别将所述每条语料的M个分类标注中每两个分类标注组成分类标注对;
分别确定每个所述分类标注对的第一模糊相关系数;
根据全部所述分类标注对的第一模糊相关系数,计算K个分类中的每个分类的模糊性指标;所述K个分类根据全部所述分类标注确定,K为正整数。
2.根据权利要求1所述的方法,其特征在于,所述分别确定每个所述分类标注对的第一模糊相关系数,包括:
在所述分类标注对的两个分类标注相同的情况下,确定所述分类标注对的第二模糊相关系数为第一预设值;
在所述分类标注对的两个分类标注不相同的情况下,确定所述分类标注对的第二模糊相关系数为第二预设值;
其中,所述第一预设值小于所述第二预设值,所述分类标注对的第一模糊相关系数为所述分类标注对的第二模糊相关系数,或者所述分类标注对的第一模糊相关系数为根据所述分类标注对的第二模糊相关系数和所述分类标注对的目标权重值计算得到的值。
3.根据权利要求2所述的方法,其特征在于,所述分类标注对的目标权重值为根据所述分类标注对的每个分类标注所对应的标注者的评分确定的权重值,所述标注者的评分根据所述标注者历史进行分类标注的准确率确定。
4.根据权利要求1所述的方法,其特征在于,所述根据全部所述分类标注对的第一模糊相关系数,计算K个分类中的每个分类的模糊性指标,包括:
分别将全部所述分类标注对中对应同一分类的分类标注对的第一模糊相关系数进行累加,得到所述K个分类中的每个分类的模糊性统计值。
5.根据权利要求4所述的方法,其特征在于,所述分别将全部所述分类标注对中对应同一分类的分类标注对的第一模糊相关系数进行累加,得到所述K个分类中的每个分类的模糊性统计值之后,所述方法还包括如下至少一项:
分别将所述K个分类中的每个分类的模糊性统计值除以所述K个分类的模糊性统计值之和,得到所述K个分类中的每个分类的类模糊指数;
将目标分类标注对的累加值除以第一分类的模糊性统计值,得到所述第一分...
【专利技术属性】
技术研发人员:刘睿,靳丁南,罗欢,权圣,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。