【技术实现步骤摘要】
一种语义的分类方法、装置、电子设备及存储介质
本申请涉及计算机
,具体而言,涉及一种语义的分类方法、装置、电子设备及存储介质。
技术介绍
随着互联网技术的迅猛发展,网络中的信息呈现爆炸式增长的态势,而这些信息的主要体现形式就是文本,如何对海量的文本做规范化的管理也变得愈发重要。对文本中的句子做有效的分类处理显然是对文本做规范化管理的重要一步。当前的分类方法通常是采用模型对文本中的句子进行分类,比如采用CNN模型对文本中的句子进行分类,亦或者采用LSTM模型对文本中的句子进行分类。但随着应用场景的不断扩展,对分类准确性的要求也越来越高,目前的准确性已逐渐无法满足实际需求。
技术实现思路
本申请实施例的目的在于提供一种语义的分类方法、装置、电子设备及存储介质,用以实现更准确的对文本进行分类。第一方面,本申请实施例提供了一种语义的分类方法,所述方法包括:获得待处理的文本;将所述文本分别输入到预设的多个语义分类器中处理,获得每个所述语义分类器输出的所述文本中句子的语义类别;综合多个所 ...
【技术保护点】
1.一种语义的分类方法,其特征在于,所述方法包括:/n获得待处理的文本;/n将所述文本分别输入到预设的多个语义分类器中处理,获得每个所述语义分类器输出的所述文本中句子的语义类别;/n综合多个所述语义类别,以确定出所述句子最终的语义类别。/n
【技术特征摘要】
1.一种语义的分类方法,其特征在于,所述方法包括:
获得待处理的文本;
将所述文本分别输入到预设的多个语义分类器中处理,获得每个所述语义分类器输出的所述文本中句子的语义类别;
综合多个所述语义类别,以确定出所述句子最终的语义类别。
2.根据权利要求1所述的语义的分类方法,其特征在于,所述多个语义分类器包括:卷积式分类器和快速分类器,将所述文本分别输入到预设的多个语义分类器中处理,获得每个所述语义分类器输出的所述文本中句子的语义类别,包括:
将所述文本输入到所述卷积式分类器中处理,获得所述卷积式分类器输出的所述句子的语义类别;以及,将所述文本输入到所述快速分类器处理,获得所述快速分类器输出的所述句子的语义类别。
3.根据权利要求2所述的语义的分类方法,其特征在于,将所述文本输入到所述卷积式分类器中处理,获得所述卷积式分类器输出的所述句子的语义类别,包括:
通过所述卷积式分类器中的Bert模型处理所述文本,获得所述文本中每个词汇的向量;
通过所述卷积式分类器中的CNN模型处理所述向量,获得所述句子的语义类别。
4.根据权利要求3所述的语义的分类方法,其特征在于,通过所述卷积式分类器中的CNN模型处理所述向量,获得所述句子的语义类别,包括:
将组成所述句子的所有词汇的向量按预设的矩阵格式叠加,获得向量矩阵;
通过所述CNN模型处理所述向量矩阵,获得所述句子的语义类别。
5.根据权利要求3所述的语义的分类方法,其特征在于,在将所述文本输入到所述卷积式分类器中处理,获得所述卷积式分类器输出的所述句子的语义类别之前,所述方法还包括:
获取包含各种句子的各训练文本;
利用训练样本集,对所述Bert模型进行调整,以及对CNN网络进行训练从而获得所述CNN模型。
6.根据权利要求5所述的语义的分类方法,其特征在于,利用训练样本集,对所述Bert模型进行调整,包括:
基于各预设的词汇,从所述各种句子中确定出由所述预设的词汇构成的句子,以及确定出所述各预设的词汇中没有的词汇;
从所述各预设的词汇中确定出与所述没有的词汇释义最接近的词汇;
调整所述释义最接近的词汇的向量,以获得所述没有的词汇的向量;
基于所述没有的词汇和所述没有的词汇的向量,调整所述Bert模型,其中,在所述Bert模型调整后,所述Bert模型处理所述没有的词汇,则对应输出所述没有的词汇的向量。
7.根据权利要求6所述的语义的分类方法,其特征在于,调整所述释义最接近的词汇的向量,以获得所述没有的词汇的向量,包括:
所述释义最接近的词汇的向量进行多次不同的调整,一一对应的获得所述没有的词...
【专利技术属性】
技术研发人员:张发恩,魏畅毅,
申请(专利权)人:深圳创新奇智科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。