【技术实现步骤摘要】
一种税务领域短文本的情感分类方法及装置
本专利技术涉及信息处理
,特别涉及一种税务领域短文本的情感分类方法及装置。
技术介绍
人工智能技术飞速发展,在金融、教育等领域取得了丰硕的成果,税收领域也不例外。在税收现代化的号角下,人工智能在纳税服务、税收风险管理、税务稽查等工作中方兴未艾,取得了突飞猛进的进展,有效提高了税务部门的工作效率。比如,在办税服务厅和12366纳税服务热线,每天有大量的纳税人咨询税收问题,为了更好满足纳税人的需求,税务部门组织研发了面向办税服务厅的智能应答机器人和面向12366纳税服务热线税务端的自动语音识别系统,这两项技术均是基于人工智能领域的语音识别和语音输出技术,包括能够识别纳税人的语音和将纳税人需要的问题答案以语音的形式读出来。一般来说,税务咨询过程中的交互对话内容的数据信息长度通常较短,通常是一个小的段落、几句话、一句话甚至一个短语,具有的稀疏性、不规范性、主题不明确性等特点,而目前税务领域的智能应答机器人和自动语音识别系统无法学习税务短文本的深层语义信息,所以不能理解人类语言情感 ...
【技术保护点】
1.一种税务领域短文本的情感分类方法,其特征在于,包括:/n对税务短文本进行预处理,利用Word2Vec模型训练所述税务短文本的词向量,获得至少一个词向量;/n基于所述至少一个词向量中每个词向量所带有的感情色彩,确定每个词向量的权重系数,并构建带有权重系数的所述词向量的二维矩阵向量;/n通过卷积神经网络对所述二维矩阵向量进行处理,获得所述税务短文本的情感分类结果。/n
【技术特征摘要】
1.一种税务领域短文本的情感分类方法,其特征在于,包括:
对税务短文本进行预处理,利用Word2Vec模型训练所述税务短文本的词向量,获得至少一个词向量;
基于所述至少一个词向量中每个词向量所带有的感情色彩,确定每个词向量的权重系数,并构建带有权重系数的所述词向量的二维矩阵向量;
通过卷积神经网络对所述二维矩阵向量进行处理,获得所述税务短文本的情感分类结果。
2.如权利要求1所述的方法,其特征在于,所述基于所述至少一个词向量中每个词向量所带有的感情色彩,确定每个词向量的权重系数,包括:
基于所述至少一个词向量中每个词向量所带有的感情色彩,使用主观赋权法、客观赋权法或主客观综合集成赋权法确定每个词向量的权重系数。
3.如权利要求2所述的方法,其特征在于,所述基于所述至少一个词向量中每个词向量所带有的感情色彩,确定每个词向量的权重系数,包括:
根据每个词向量在所述税务短文本中的出现位置、出现频率以及词语关系计算每个词向量的权重系数。
4.如权利要求1-3任一项所述的方法,其特征在于,所述卷积神经网络包括多个局部特征提取层,每个局部特征提取层包括一个卷积层和一个池化层;通过卷积神经网络对所述二维矩阵向量进行处理,获得所述税务短文本的情感分类结果,包括:
通过所述多个特征提取层对所述二维矩阵向量中的词向量进行多次局部特征提取操作,通过最后一次局部特征提取操作获得多个最优局部特征;其中,每次局部特征提取操作包括一次卷积操作和一次池化操作;
通过卷积神经网络中的全连接层对所述多个最优局部特征进行处理,得到全局特征;
通过Softmax分类器对所述全局特征进行处理,获得所述税务短文本的情感分类结果。
5.一种税务领域短文本的情感分类装置,其特征在于,包括:
训练模块,用于对税务短文本进行预处理,利用Word2Vec模型训练所述税务短文本的词向量,获...
【专利技术属性】
技术研发人员:王芳,林文辉,王志刚,孙科武,杨硕,赖新明,王亚平,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。