The invention relates to an emotional annotation method and its system, which includes receiving the text to be annotated, using at least one training model in advance to treat the annotation text for emotional analysis, determining the emotional label for the text to be annotated, and labeling the emotional label for the text to be annotated. The emotion annotation method, which is provided by the embodiment of the invention, is used to extract and transform the emotion words into the word feature vectors to train the model. The emotion annotation is used in the recognition text, and the emotion expression ability is optimized. At the same time, the accuracy of the emotion analysis is improved by the training model.
【技术实现步骤摘要】
情感标注的方法及其系统
本专利技术设计数据分析
,尤其涉及一种情感标注的方法及其系统。
技术介绍
歌词情感分类通常是使用词语和词频作为特征向量,然后使用向量特征模型等常用的机器学习进行分析。但通常使用的歌曲情感分类方法使用的词语和词频作为特征向量的粒度比较粗,或者说精度不够高,容易忽略一些隐含的联系,例如歌曲中的“我不快乐”,采用粗粒度的词向量,可能提取到的词为“快乐”,造成表达错误,或情感表达弱化的现象,以至于情感分类的准确率降低。
技术实现思路
本专利技术提供了一种情感标注的方法及其系统,结合情感词提取和word2wec的词特征向量的构建方法,优化了特征向量的表达能力,优化了文本,例如歌词的情感分析效果,提高了文本情感分类的准确率。第一方面,本专利技术实施例提供了一种情感标注方法,该方法可以包括:接收待标注文本;采用预先训练好的至少一个训练模型对待标注文本进行情感分析,确定待标注文本的情感标签;为待标注文本标注情感标签。结合情感词提取和将情感词转换为词特征向量进行模型训练,并对待识别文本进行情感标注,优化了情感表达能力,同时,提高了训练模型对情感分析的准确率。可选地,在采用预先训练好的至少一个训练模型对待标注文本进行情感分析,确定待标注文本的情感标签之前,方法还包括:按照至少一个情感标签获取每个情感标签的训练集,训练集包括多个待训练文本;提取每个训练集包括的多个待训练文本的情感词;确定情感词的词向量;对每个训练集包括的多个待训练文本的情感词的词向量进行模型训练,得到训练模型。可选地,确定情感词的词向量,包括:使用Word2ved确定情感词的词向量。可 ...
【技术保护点】
1.一种情感标注的方法,其特征在于,所述方法包括:接收待标注文本;采用预先训练好的至少一个训练模型对所述待标注文本进行情感分析,确定所述待标注文本的情感标签;为所述待标注文本标注所述情感标签。
【技术特征摘要】
1.一种情感标注的方法,其特征在于,所述方法包括:接收待标注文本;采用预先训练好的至少一个训练模型对所述待标注文本进行情感分析,确定所述待标注文本的情感标签;为所述待标注文本标注所述情感标签。2.根据权利要求1所述的方法,其特征在于,在所述采用预先训练好的至少一个训练模型对所述待标注文本进行情感分析,确定所述待标注文本的情感标签之前,所述方法还包括:按照至少一个情感标签获取每个情感标签的训练集,所述训练集包括多个待训练文本;提取每个所述训练集包括的所述多个待训练文本的情感词;确定所述情感词的词向量;对每个所述训练集包括的多个待训练文本的情感词的所述词向量进行模型训练,得到训练模型。3.根据权利要求1或2所述的方法,其特征在于,所述确定所述情感词的词向量,包括:使用Word2ved确定所述情感词的词向量。4.根据权利3所述的方法,其特征在于,所述使用Word2ved确定所述情感词的词向量,包括:采用所述Word2ved包括的CBOW算法确定所述情感词的词向量。5.根据权利要求3所述的方法,其特征在于,所述使用Word2ved确定所述情感词的词向量,包括:采用所述Word2ved包括的Skip-gram...
【专利技术属性】
技术研发人员:马明,
申请(专利权)人:北京酷我科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。