【技术实现步骤摘要】
文本分类方法、装置、设备及存储介质
本专利技术涉及通信
,尤其涉及一种文本分类方法、装置、设备及存储介质。
技术介绍
随着机器学习的研究与应用在工业界越来越重视,人工智能已经广泛应用于语音识别、图像处理、文本语义理解、个性化推荐等各个领域,大数据时代的到来,使机器能够获得新的知识技能。在电商平台,用户喜欢用更智能的方式网上购物,如何挖掘智能的购物助手显得很关键。现有技术中电商平台通常提供查询搜索服务,例如查询商品、品牌、优惠券、服务等,需要提前设计好话术模板,在接收到用户输入的查询请求后通过将查询文本与模板进行正则匹配,从而将用户输入的文本匹配到对应业务场景类别。现有技术中通过话术模板正则匹配,对人工的依赖比较大,话术需要预先设置,维护成本高,分类预测句式死板,无法灵活地对用户意图做出理解和预测。
技术实现思路
本专利技术提供一种文本分类方法、装置、设备及存储介质,以减小对人工的依赖,降低维护成本,实现根据用户输入的查询请求灵活地对用户意图做出理解和预测。第一方面,本专利技术实施例提供一种文本分类方法,包括:接收用户输入的查询请求,所述查询请求包括查询文本;对所述查询文本提取文本特征;将所述文本特征输入到场景分类模型中,获得所述查询请求对应的业务场景。第二方面,本专利技术实施例提供一种文本分类装置,包括:接收模块,用于接收用户输入的查询请求,所述查询请求包括查询文本;特征提取模块,用于对所述查询文本提取文本特征; ...
【技术保护点】
1.一种文本分类方法,其特征在于,包括:/n接收用户输入的查询请求,所述查询请求包括查询文本;/n对所述查询文本提取文本特征;/n将所述文本特征输入到场景分类模型中,获得所述查询请求对应的业务场景。/n
【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:
接收用户输入的查询请求,所述查询请求包括查询文本;
对所述查询文本提取文本特征;
将所述文本特征输入到场景分类模型中,获得所述查询请求对应的业务场景。
2.根据权利要求1所述的方法,其特征在于,所述获得所述查询请求对应的业务场景后,还包括:
若所述查询请求对应的业务场景为频道查询,则确定所述查询请求对应的频道,并进入该频道。
3.根据权利要求2所述的方法,其特征在于,所述确定所述查询请求对应的频道,包括:
判断所述查询文本是否满足预设语句格式且包含预设频道关键词;
若是,则根据所述预设频道关键词确定所述查询请求对应的频道;
若否,则将所述查询文本输入到模糊语义分类模型中,确定所述查询请求对应的频道。
4.根据权利要求3所述的方法,其特征在于,所述将所述查询文本输入到模糊语义分类模型中,确定所述查询请求对应的频道,包括:
获取所述查询文本与任一频道语料库中语料的相似度;
获取相似度最大的频道,作为所述查询请求对应的频道。
5.根据权利要求4所述的方法,其特征在于,所述获取所述查询文本与任一频道语料库中语料的相似度,包括:
根据所述查询文本获取查询文本的空间向量;
获取所述查询文本的空间向量与任一频道语料库的空间向量的相似度,其中所述任一频道语料库的空间向量为该频道语料库中所有语料组合成的文章的空间向量。
6.根据权利要求4所述的方法,其特征在于,所述将所述查询文本输入到模糊语义分类模型中,确定所述查询请求对应的频道,还包括:
采用支持向量机确定所述查询请求对应的频道;或者
将根据相似度获得的结果和根据支持向量机获得的结果相结合,确定所述查询请求对应的频道。
7.根据权利要求3所述的方法,其特征在于,所述将所述查询文本输入到模糊语义分类模型中前,还包括:
判断所述查询文本是否为预设模糊语句,若是,则根据所述预设模糊语句对应的频道确定所述查询请求对应的频道;和/或
判断所述查询文本是否包含频道关键词库中的词语,若是,则根据所述频道关键词库中的词语对应的频道确定所述查询请求对应的频道。
8.根据权利要求1所述的方法,其特征在于,所述对所述查询文本提取文本特征前,还包括:
判断所述查询文本是否为产品词库或品牌词库中的词语,若是,则确定所述查询请求对应的业务场景为商品查询业务场景。
9.根据权利要求1-8任一项所述的方法,其特征在于,还包括:
获取场景分类模型的训练样本;
构建神经网络,采用所述训练样本对所述神经网络进行训练,从而得到所述场景分类模型。
10.一种文本分类装置,其特征在于,包括:
接收模块,用于接收用户输入的查询请求,所述查询请求包括查询文本;
特征提取模块,用于对所述查询文本提取文本特征;
业务场景分类模块,...
【专利技术属性】
技术研发人员:王颖帅,李晓霞,苗诗雨,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。