一种句子文本的问题分类处理方法及装置制造方法及图纸

技术编号:36211892 阅读:18 留言:0更新日期:2023-01-04 12:08
本发明专利技术提供一种句子文本的问题分类处理方法及装置,涉及文本数据处理技术领域,可用于金融领域或其他技术领域。所述方法包括:对待进行问题分类的句子文本进行切分,得到各字符,并对各字符进行向量化;基于BERT模型对向量化处理结果进行识别,得到字符级别的句子向量和各字符的增强向量,并根据各字符的增强向量得到词语级别的句子向量;拼接字符级别的句子向量和词语级别的句子向量,并根据拼接结果得到所述待进行问题分类的句子文本的问题分类类别。所述装置执行上述方法。本发明专利技术实施例提供的句子文本的问题分类处理方法及装置,能够提高句子文本的问题分类的准确性。够提高句子文本的问题分类的准确性。够提高句子文本的问题分类的准确性。

【技术实现步骤摘要】
一种句子文本的问题分类处理方法及装置


[0001]本专利技术涉及文本数据处理
,具体涉及一种句子文本的问题分类处理方法及装置。

技术介绍

[0002]随着计算机行业的快速发展,硬件性能取得了飞跃性的提升,越来越多的人们利用其计算能力开始了机器学习的研究。在中文文本领域中,一大批人们开始研究智能问答。问答一般分为两个类别:基于开放域的知识问答和基于专业领域的问答。针对专业领域的问答,需要专业的领域知识,比如金融,银行等相关的行业,需要对应的知识数据库进行专业性问题的回答。
[0003]在问答的过程中,语句较短,口语化严重,往往需要结合上下文进行理解,另外单单用字符表示语义,忽略了文本的词语的含义,而往往在中文中,词语的含义比较重要,如果单单使用词语的含义忽略了字符本身,使得句子的问题分类结果不够准确。

技术实现思路

[0004]针对现有技术中的问题,本专利技术实施例提供一种句子文本的问题分类处理方法及装置,能够至少部分地解决现有技术中存在的问题。
[0005]一方面,本专利技术提出一种句子文本的问题分类处理方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种句子文本的问题分类处理方法,其特征在于,包括:对待进行问题分类的句子文本进行切分,得到各字符,并对各字符进行向量化;基于BERT模型对向量化处理结果进行识别,得到字符级别的句子向量和各字符的增强向量,并根据各字符的增强向量得到词语级别的句子向量;拼接字符级别的句子向量和词语级别的句子向量,并根据拼接结果得到所述待进行问题分类的句子文本的问题分类类别。2.根据权利要求1所述的句子文本的问题分类处理方法,其特征在于,所述根据各字符的增强向量得到词语级别的句子向量,包括:基于多尺度CNN模型对各字符的增强向量进行局部特征提取,得到词语级别的句子向量。3.根据权利要求1所述的句子文本的问题分类处理方法,其特征在于,所述根据拼接结果得到所述待进行问题分类的句子文本的问题分类类别,包括:通过全连接和sigmoid函数对根据拼接结果得到的完整句子向量进行处理,得到所述待进行问题分类的句子文本的问题分类类别。4.根据权利要求1所述的句子文本的问题分类处理方法,其特征在于,在所述对待进行问题分类的句子文本进行切分的步骤之前,所述句子文本的问题分类处理方法还包括:获取待进行专业领域识别的句子文本;基于二分类模型对待进行专业领域识别的句子文本进行专业领域识别;若确定专业领域识别结果为专业领域问题,则将所述待进行专业领域识别的句子文本确定为所述待进行问题分类的句子文本。5.一种句子文本的问题分类处理装置,其特征在于,包括:切分单元,用于对待进行问题分类的句子文本进行切分,得到各字符,并对各字符进行向量化;识别单元,用于基于BERT模型对向量化处理结果进行识别,得到字符级别的句子...

【专利技术属性】
技术研发人员:祁江楠雷禹袁玥
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1