【技术实现步骤摘要】
基于规则匹配和深度学习的用户质检需求分类方法及系统
本专利技术涉及检验检测服务领域以及机器学习领域,具体涉及一种基于规则匹配和深度学习的用户质检需求分类方法及系统。
技术介绍
国内第三方检验检测网站内有各行业检验检测机构入驻,提供产品的质量检验检测服务,用户可通过主动联系或发布质检需求信息的方式联系机构。面对大量专业的检测服务,用户倾向于在网站内发布产品检测需求信息,让符合检测条件的机构联系。为实现用户需求与检测服务的准确匹配,将质检需求按行业分类是关键步骤。目前质检需求信息的分类主要由用户手动分类完成,效率较低且常出现误分类的情况。用户质检需求信息由检测待检测样品名称、检测内容、检测地点等组成,各行业发布的质检需求数量不均衡,且用户发布的文本信息较短、口语化、特征稀疏,为实现用户质检需求按行业自动分类需设计合适的分类模型,以提高质检需求文本分类的效率和准确率。为此,可利用自然语言处理和深度学习方法自动学习质检需求文本与行业标签间的联系,将训练好的分类模型应用于质检需求的分类,以此实现用户质检需求按行业自动、高效分类。 >目前,现有用户质检本文档来自技高网...
【技术保护点】
1.一种基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,包括:/n1)对待分类文本与各个行业的专有名词词典进行匹配,并计算与各个行业对应的行业标签之间匹配的行业概率P
【技术特征摘要】
1.一种基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,包括:
1)对待分类文本与各个行业的专有名词词典进行匹配,并计算与各个行业对应的行业标签之间匹配的行业概率Pi,选择值最大的行业概率Pi记为最大行业概率值P;
2)若最大行业概率值P大于等于预设阈值G,则将最大行业概率值P对应的行业标签作为分类结果输出;否则,跳转执行下一步;
3)对待分类文本利用深度学习模型预测行业标签并计算预测的行业概率值H;针对最大行业概率值P、预测的行业概率值H两者,选择其中概率较大者所对应的行业标签作为最终的分类结果输出。
2.根据权利要求1所述的基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,步骤1)包括:
1.1)首先提取待分类文本中的待检测样品名称和检测内容,然后分别将待检测样品名称和检测内容与各个行业的专有名词词典中的待检测样品名称和检测内容的专有词汇进行匹配,从而得到待检测样品名称的匹配状态s以及检测内容匹配的单词个数n;
1.2)根据待检测样品名称的匹配状态s以及检测内容匹配的单词个数n计算与各个行业对应的行业标签之间匹配的行业概率值Pi;
1.3)选择值最大的行业概率值Pi记为最大行业概率值P。
3.根据权利要求2所述的基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,步骤1.2)中行业概率值Pi的计算函数表达式为:
Pi=a1*s+a2*n,
上式中,a1为待检测样品名称的权重,a2为每匹配一个词汇权重值增加的权重,s为待检测样品名称的匹配状态,待检测样品名称的匹配状态取值为0或1,0表示不匹配,1表示匹配,n为检测内容匹配的单词个数,其中a2*n在超过上限值时取上限值。
4.根据权利要求1所述的基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,步骤1)之前还包括构建各个行业的专有名词词典的步骤:首先对各个行业的质检需求中的待检测样品名称和检测内容进行汇总,然后进行分词、去停用词和去重复词处理,最终得到各个行业的专有名词词典。
5.根据权利要求1所述的基于规则匹配和深度学习的用户质检需求分类方法,其特征在于,所述待分类文本...
【专利技术属性】
技术研发人员:滕召胜,龚冬成,杨智君,唐求,刘涛,吴娟,林海军,朱坤志,何民军,杨唐胜,欧阳博,成达,
申请(专利权)人:湖南大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。