一种基于现代汉语语法经济安全领域的长文本情感分析方法技术

技术编号:43841838 阅读:24 留言:0更新日期:2024-12-31 18:37
本发明专利技术公开了一种基于现代汉语语法经济安全领域的长文本情感分析方法,包括以下步骤:获取网络舆情数据;数据预处理;将文本归类,并均衡样本比例;利用经济安全领域的专有名词词典进行词汇级分词;模型搭建;通过随机初始化词嵌入矩阵并获取静态词向量;采用相对位置编码定义位置编码器层;利用双向Transformer模型进行特征提取;通过多头自注意力机制增强语义表示;分段处理超长文本并通过注意力机制建立段落间的关系;通过全连接层和Softmax函数将特征转换为情感分类的概率分布。本发明专利技术使用了经济安全领域专有词典,替代了传统的以单个字分词,采用了相对位置编码替代传统Transformer的绝对位置编码,让模型自己去学习,调整网络里的参数。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,具体是一种基于现代汉语语法经济安全领域的长文本情感分析方法


技术介绍

1、文本情感分析,亦称为意见挖掘或倾向性分析,是一种对蕴含情感的主观性文本进行深入分析、处理、归纳和逻辑推理的复杂过程。在互联网空间,尤其是博客、论坛以及社会服务网络平台如大众点评等,用户生成了海量的参与性评论,这些内容针对人物、事件、产品等主题,蕴含着丰富的情感表达和倾向性,如喜怒哀乐、批评与赞扬等。

2、基于这些数据,文本情感分析旨在揭示和量化这些情感色彩,为潜在用户提供一种通过审视主观性评论,以洞察公众舆论对特定事件或产品观点的途径。这种分析方法,不仅有助于理解公众情绪的动态变化,还能为企业提供市场情报,帮助它们优化决策,提升用户体验,并最终推动商业策略的发展。

3、基于规则的情感分析通常是指观点抽取(opinion extraction)。观点抽取(opinion extraction)是从某一立场或角度出发对事物所持的看法或态度,是一种表达了感觉、看法、信念的陈述。观点的情感倾向也称为极性,可以是正面(褒义,pos itiv本文档来自技高网...

【技术保护点】

1.一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤S1中网络舆情数据来源于网络爬虫获取的企业舆情,特别是与经济安全相关的企业和银行报道。

3.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤S2.2中文本的分类为积极、中立和消极。

4.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤S2.3中经济安全领域的专有名词词典基于《中国百...

【技术特征摘要】

1.一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤s1中网络舆情数据来源于网络爬虫获取的企业舆情,特别是与经济安全相关的企业和银行报道。

3.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤s2.2中文本的分类为积极、中立和消极。

4.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤s2.3中经济安全领域的专有名词词典基于《中国百科大辞典》法学领域的词条整理而成,所述对专有名词进行“词汇级”的分词。

5.根据权利要求1所述的一种基于现代汉语语法经济安全领域的长文本情感分析方法,其特征在于:所述步骤s3.3中transformer模型用于联系了上下文语义关...

【专利技术属性】
技术研发人员:白凤波秦董洪徐晨鲍冬雪李路路王敬凯孔令儒
申请(专利权)人:广西民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1