一种基于神经网络的鱼病描述情感词的提取方法技术

技术编号：33706517 阅读：17 留言：0更新日期：2022-06-06 08:30

一种基于神经网络的鱼病描述情感词的提取方法，其属于情感词分析的技术领域。该方法是在先验知识的基础之上，通过神经网络去学习文本语义信息中的情感知识的部分，从而辅助远程疾病诊断。具体表现为，在输入端由用户提供的一系列鱼病描述，然后加上人工标注的鱼病方面类别和情感极性构成数据集传入预训练模型，转化为词向量，传入序列模型处理语句中的时序关系。最后把处理好的语义信息传入分类模型中去，完成鱼病描述中情感词的提取和分析。与现有的基于专家系统的鱼病诊断方法相比，本发明专利技术是为了减少对先验知识和规则的依赖，去提取语义信息中的情感词部分。义信息中的情感词部分。义信息中的情感词部分。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络的鱼病描述情感词的提取方法

[0001]本专利技术涉及基于方面的情感词分析的
，尤其涉及一种基于神经网络的鱼病描述情感词的提取方法。

技术介绍

[0002]随着计算机技术的发展，使用互联网的人数高速增长，截止目前为止，全球手机用户超过50亿，互联网用户也达到45亿。这其中社交媒体用户有42亿。这些数字占了世界总人口的多数。可以想象互联网每天都会产生难以想象的数量。这种级别的数据给了人工智能高速发展的机会，同时人工智能也深深改变了我们的生活方式。
[0003]自然语言处理(Natural Language Processing,NLP)是人工智能领域的一个重要方向，是一门研究如何让机器理解人类语言的学科，研究能实现人与计算机之间用自然语言进行有效交互的方法。同时随着网络使用人数的增加，越来越多的人可以再社交平台上发表自己的观点，分享自己的想法。因此在诸多开放性的平台上，有着众多带有情感色彩和倾向性的言论。这些言论的分析对于现实有种重大意义。不仅可以预测客户的喜好，人民的感情基调，同时可以对风险进行预估。所以现阶段情感分析任务十分关键。
[0004]近年来，情感分析成为了NLP中最活跃的研究方向之一，在信息检索，文本挖掘中有着广泛应用。由于互联网作为一个表达和分享的重要社交平台，他给用户带来了丰富的包含了情感倾向的话题。而文本情感分析是对这类带有情感倾向的文本进行分析，处理，归纳和推理的过程。其中基于方面的情感分析子任务帮助商家和企业获得有价值的反馈信息，从而改善他们的产品。到目前为...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的鱼病描述情感词的提取方法，其特征在于，主要包含以下步骤：S1.基于线下鱼病诊断过程，进行方面类别和情感极性划分；S11.方面类别划分根据在诊断过程中临床表现为主，时空因素为辅的前提，将鱼病描述划分为两大类：临床因素和时空因素；具体分析所收集的文本数据特征，予以细分；其中临床因素包括体表、体内、体态、体格和鱼鳃五个方面，时空因素包括环境和时节两部分；S13.情感极性划分结合参考文本与具体问题，将情感极性划分为积极、中性、偏消极、消极；因此，鱼病描述的方面包括体表、体内、体态、体格、鱼鳃、环境和时节共7个方面类别，情感极性包括积极、中性、偏消极、消极四种；S2.对数据集的处理：S21.把收集到的鱼类疾病描述进行预处理，剔除空格和非中文字符；S22.进行人工标注方面类别和情感极性，采用三人标注同一数据集，标注结果由得票数多的决定；S23.从数据分布、数据标注分布和数据组内相关系数三个方面对数据集进行数据分析，并将数据集按照6：2：2划分为训练集、验证集和测试集；S3.基于神经网络的鱼病描述情感词方法模型包括三大部分：一是语义嵌入层，得到向量化后的文本表示；二是语义决策层，通过序列模型获得深层语义信息；三是分类层，用于预测情感类别和情感极性；具体包括以下内容：S31.语义嵌入层：把训练集、验证集和测试集三份数据集整合成三个数据迭代器，迭代器的配置按照BERT模型的规格传入，设置Batch为8，即一次只传入8个句子；把迭代器中的数据传入BERT模型转化为文本向量，具体操作步骤如下：(1)传入一个Batch大小的文本序列T＝{t0，t1，t2，t3，t4，t5，t6，t7}，每个t＝{w1，w2，w3，w4，...，wn}由n个词组成；(2)文本序列T中的每个文本序列t会通过利用BERT被映射到一个维度固定的向量空间，获得其初始的word embedding，文本序列t中每个词组w会根据其所属句子和所处句中位置获得一个segment embedding和position embedding；(3)把三个向量相加获得每个词组w的输入向量x；Bert中一共有12层transformer，每个transformer中有Encoder和Decoder分别对传入词向量进行编码和解码；在编码和解码过程中不断通过前馈神经网络和归一化；最终在输出端得到一个768维度词向量；hi＝Bert(xi)i∈(1，N)
ꢀꢀꢀꢀ...

【专利技术属性】
技术研发人员：张思佳，吴杰，丛子涵，姜鑫，于英囡，孙华，刘明剑，
申请(专利权)人：大连海洋大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人