【技术实现步骤摘要】
基于人工智能的文本分类方法、装置、设备及介质
[0001]本专利技术涉及人工智能
,尤其涉及一种基于人工智能的文本分类方法、装置、设备及存储介质。
技术介绍
[0002]文本分类是一种自然语言处理任务,可按照一定的分类体系或标准对用户输入的文本进行自动分类标记。
[0003]目前,现有技术在对文本进行分类时,大多仅是将文本输入某个分类模型中进行预测,对于包含企业名称及企业经营范围信息的文本,缺少对文本的输入模型前的处理,利用该方案并不能准确的得到企业的行业分类标签。因此亟需提供一种分类准确率更高的文本分类方法来对根据企业文本信息进行标签分类。
技术实现思路
[0004]鉴于以上内容,本专利技术提供一种基于人工智能的文本分类方法、装置、设备及存储介质,其目的在于解决现有技术中对根据企业文本信息进行标签分类准确率低的技术问题。
[0005]为实现上述目的,本专利技术提供一种基于人工智能的文本分类方法,该方法包括:
[0006]响应用户发出的文本分类请求并获取待分类文本,对所述待分类文 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的文本分类方法,应用于电子设备,其特征在于,所述方法包括:响应用户发出的文本分类请求并获取待分类文本,对所述待分类文本执行预处理操作以确定所述待分类文本中的第一文本和第二文本;拼接所述第一文本与所述第二文本得到所述待分类文本的拼接文本,对所述拼接文本执行分词操作得到拼接文本对应的多个分词;将所述多个分词输入Bert模型得到所述拼接文本的第一文本向量,将所述多个分词输入Glove模型得到所述拼接文本的第二文本向量,对所述第一文本向量及所述第二文本向量执行融合操作,得到所述拼接文本的目标文本向量;将所述目标文本向量输入预先构建的文本分类模型中,得到所述待处理文本的目标分类结果,并将所述目标分类结果反馈至所述用户。2.如权利要求1所述的基于人工智能的文本分类方法,其特征在于,所述将所述多个分词输入Bert模型得到所述拼接文本的第一文本向量,包括:将所述多个分词输入Bert模型得到每个分词对应的第一词向量,基于每个分词对应的第一词向量,利用下述公式计算所述第一文本向量:其中,V
Bert
表示所述第一文本向量,V
1i
表示第i个分词的第一词向量,m表示所述多个分词的总数量。3.如权利要求1所述的基于人工智能的文本分类方法,其特征在于,所述将所述多个分词输入Glove模型得到所述拼接文本的第二文本向量,包括:将所述多个分词输入Glove模型得到每个分词对应的第二词向量,基于每个分词对应的第二词向量,利用下述公式计算所述第二文本向量:其中,V
glove
表示所述第二文本向量,V
2i
表示第i个分词的第二词向量,m表示所述多个分词的总数量。4.如权利要求1所述的基于人工智能的文本分类方法,其特征在于,所述对所述第一文本向量及所述第二文本向量执行融合操作,包括:利用下述公式执行融合操作:V
input
=αV
Bert
+(1
‑
α)V
glove
其中,V
input
表示所述目标文本向量,V
Bert
表示所述第一文本向量,V
glove
表示第二文本向量,α表示权重参数。5.如权利要求1所述的基于人工智能的文本分类方法,其特征在于,所述文本分类模型的训练过程包括:获取预设数量的样本文本,为各样本文本标注类别标签,将各样本文本作为自变量、各样本文本的类别标签作为因变量生成样本集;将所述样本集中每个样本输入预先构建的模型,得到所述样本集中每个样本的预测类别,所述预先构建的模型包括BiLSTM
‑
Attentio...
【专利技术属性】
技术研发人员:旷雄,郑越,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。