文本分类方法、装置及设备制造方法及图纸

技术编号:25835531 阅读:31 留言:0更新日期:2020-10-02 14:16
本申请公开了一种文本分类方法、装置及设备,涉及文本分类技术领域,使得网络平台能够准确对餐品描述信息所形成的文本进行分类,提高文本分类效果。其中方法包括:获取对餐品描述信息进行处理后所形成的文本特征;将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,所述文本分类模型用于预测文本特征在各个类目上的概率值,所述分类结果为预测得到概率值最高时对应文本特征的类目;通过统计所述文本特征映射的多个分类结果中类目的占比值,将占比值最高的类目确定为所述文本特征映射的最终分类结果。

【技术实现步骤摘要】
文本分类方法、装置及设备
本申请涉及文本分类
,尤其是涉及到一种文本分类方法、装置及设备。
技术介绍
随着互联网技术的不断发展,网络往早已成为现代人生活不可或缺的部分,网上订餐由于其独有的便捷性和直观性而受到用户的欢迎。为了便于用户浏览,网络平台端会对线上实体对象提供的餐品描述信息进行分类整理,并将分类整理后的餐品描述信息投放至网络平台,进而在网络平台中展示餐品描述信息,以供用户选取。通常情况下,网络平台在对线上实体对象提供的餐品描述信息进行分类整理的过程可以转行为对餐品描述信息中文本进行分类的过程,具体可以通过使用深度学习的分类算法来对餐品描述信息形成的文本进行分类,从而判断出餐品对象所属的类目。然而,针对同一个餐品对象,由于线上实体对象所经营的类型不同,该餐品对象在不同线上实体对象所属的类目不同,例如,针对餐品“金针菇”而言,在烧烤实体对象中所属类目“烧烤>菌菇类”为,而在炒菜实体对象中所属的类目为“菜品>热菜”,另外还有对于实体对象为了吸引用户自命名的餐品,对于上述餐品对象类目划分模糊以及文本命名规则不规范的餐品本文档来自技高网...

【技术保护点】
1.一种文本分类方法,其特征在于,包括:/n获取对餐品描述信息进行处理后所形成的文本特征;/n将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,所述文本分类模型用于预测文本特征在各个类目上的概率值,所述分类结果为预测得到概率值最高时对应文本特征的类目;/n通过统计所述文本特征映射的多个分类结果中类目的占比值,将占比值最高的类目确定为所述文本特征映射的最终分类结果。/n

【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:
获取对餐品描述信息进行处理后所形成的文本特征;
将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,所述文本分类模型用于预测文本特征在各个类目上的概率值,所述分类结果为预测得到概率值最高时对应文本特征的类目;
通过统计所述文本特征映射的多个分类结果中类目的占比值,将占比值最高的类目确定为所述文本特征映射的最终分类结果。


2.根据权利要求1所述的方法,其特征在于,所述具有不同网络分类结果的文本分类模型中包括具有深度神经网络结构的第一分类模型、具有浅层网络结构的第二分类模型、具有卷积神经网络结构的第三分类模型,所述将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,具体包括:
将所述文本特征输入至第一分类模型中进行预测,得到文本特征映射的第一分类结果;
将所述文本特征输入至第二分类模型中进行预测,得到文本特征映射的第二分类结果;
将所述文本特征输入至第三分类模型中进行预测,得到文本特征映射的第三分类结果。


3.根据权利要求2所述的方法,其特征在于,所述第一分类模型包括用于对文本特征中不同的描述特征进行预测的分类子模型,所述将所述文本特征输入至第一分类模型中进行预测,得到文本特征映射的第一分类结果,具体包括:
通过分析所述文本特征描述对象的维度信息,将所述文本特征划分为不同的描述特征;
确定所述不同的描述特征在第一分类模型所映射的分类子模型;
将所述不同的描述特征分别输入至第一分类模型所映射的分类子模型中进行预测,输出不同的描述特征在实体对象中所映射的类目;
通过汇总所述不同的描述特征在实体对象中所映射的类目,得到文本特征映射的第一分类结果。


4.根据权利要求3所述的方法,其特征在于,所述通过分析所述文本特征描述对象的维度信息,将所述文本特征划分为不同的描述特征,具体包括:
通过分析所述文本特征描述对象的维度信息,提取从不同维度上描述对象的描述特征;
将所述从不同维度上描述对象的描述特征划分为对象文本的描述特征、实体对象文本的描述特征、对象图片的描述特征。


5.根据权利要求2所述的方法,其特征在于,所述第二分类模型包括用于对文本特征中对象文本的描述特征进行预测的单层分类子模型,所述将所述文本特征输...

【专利技术属性】
技术研发人员:王君吉张朝胜徐琪
申请(专利权)人:浙江口碑网络技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1