一种文本特征分析的方法和装置制造方法及图纸

技术编号:21548085 阅读:35 留言:0更新日期:2019-07-06 21:33
本发明专利技术公开了一种文本特征分析的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取目标文本中的特征词,确定所述特征词与所述目标文本中各词语之间的语法结构;根据所述语法结构以及预设的评价对象语法结构提取规则,确定所述目标文本中与所述特征词相应的评价对象;计算所述特征词与所述评价对象的特征值,得到所述目标文本的特征值,确定所述目标文本的特征。该实施方式依据特征词与各词语的语法结构,提高了评价对象的覆盖范围以及获取准确率,以及确定目标文本特征的准确性。

A Method and Device for Text Feature Analysis

【技术实现步骤摘要】
一种文本特征分析的方法和装置
本专利技术涉及计算机
,尤其涉及一种文本特征分析的方法和装置。
技术介绍
情感分析,主要是从文本中挖掘出用户表达的观点以及情感极性,用于帮助其他用户做决定。而情感倾向获取主要集中于情感信息提取工作,即提取文本中的情感词和评价对象,以挖掘出文本中每个评价对象与情感词组合所表达的情感值。用户可以通过浏览这些带有主观色彩的词语来了解该文本所表达的观点或者情感。但同一情感词修饰不同的评价对象时,其极性也不相同,例如情感词“下降”的语义极性为负,“利润下降”为负极性情感短语,但“成本下降”为正极性情感短语,因此评价对象-情感词对的识别有助于进一步判定该评价对象的情感倾向性。现有技术中对于文本情感挖掘的相关挖掘,主要集中在商品评论领域,且一般使用词性规则以及词典匹配等手段进行文本情感挖掘。在实现本专利技术过程中,专利技术人发现现有技术至少存在如下问题:现有技术所提供的情感挖掘方式,往往忽略文本中句子结构中的关系,只抽取句子中的核心词而丢失部分评价对象信息,从而导致评价对象的语义不完整,不利于文本情感挖掘,存在情感分析错误的情况。
技术实现思路
有鉴于此,本专利技术本文档来自技高网...

【技术保护点】
1.一种文本特征分析的方法,其特征在于,包括:获取目标文本中的特征词,确定所述特征词与所述目标文本中各词语之间的语法结构;根据所述语法结构以及预设的评价对象语法结构提取规则,确定所述目标文本中与所述特征词相应的评价对象;计算所述特征词与所述评价对象的特征值,得到所述目标文本的特征值,确定所述目标文本的特征。

【技术特征摘要】
1.一种文本特征分析的方法,其特征在于,包括:获取目标文本中的特征词,确定所述特征词与所述目标文本中各词语之间的语法结构;根据所述语法结构以及预设的评价对象语法结构提取规则,确定所述目标文本中与所述特征词相应的评价对象;计算所述特征词与所述评价对象的特征值,得到所述目标文本的特征值,确定所述目标文本的特征。2.根据权利要求1所述的方法,其特征在于,所述根据所述语法结构以及预设的评价对象语法结构提取规则,确定所述目标文本中与所述特征词相应的评价对象包括:当所述特征词在所述目标文本中充当谓语时,确定与所述特征词相应的主语为第一评价对象;或当所述特征词在所述目标文本中充当谓语的宾语、状语或补语时,确定与所述特征词相应的主语和谓语为第二评价对象;或当所述特征词在所述目标文本中充当宾语的状语或补语时,确定与所述特征词相应的主语、谓语和宾语为第三评价对象;或当所述特征词在所述目标文本中充当定语时,确定与所述特征词相应的非特征词为第四评价对象。3.根据权利要求1所述的方法,其特征在于,还包括:当存在与所述评价对象相应的并列词语时,确定所述并列词语为第五评价对象;或当存在与所述评价对象相应的定语时,添加与所述定语相应的非特征词至所述评价对象中,生成第六评价对象。4.根据权利要求1所述的方法,其特征在于,所述根据所述语法结构以及预设的评价对象语法结构提取规则,确定所述目标文本中与所述特征词相应的评价对象之后,还包括:当存在与所述特征词相应的并列词语或连动词语时,确定所述并列词语或连动词语为第一特征词,同时确定所述评价对象为与所述第一特征词相应的第七评价对象;所述计算所述特征词与所述评价对象的特征值,得到所述目标文本的特征值,确定所述目标文本的特征包括:计算所述特征词与所述评价对象的特征值,以及所述第一特征词与所述第七评价对象的特征值,得到所述目标文本的特征值,确定所述目标文本的特征。5.根据权利要求1所述的方法,其特征在于,还包括:分析所述目标文本中各词语的词性特征,获取与所述特征词的距离在预定距离范围内的名词为第八评价对象。6.根据权利要求1所述的方法,其特征在于,所述计算所述特征词与所述评价对象的特征值,得到所述目标文本的特征值,确定所述目标文本的特征包括:计算所述评价对象与预定的每个代表对象之间的相似度,确定相似度超出预定相似度阈值的代表对象,替换所述评价对象为所确定的代表对象;计算所述特征词与所确定的代表对象的特征值,得到所述目标文本的特征值,获取所述目标文本的特征。7.根据权利要求1-6中任一项所述的方法,其特征在于,所述特征词为情感词,所述特征值为情感值。8.一种文本特征分析的装置,其特征在于,包括:语法结构确定模块,用于获...

【专利技术属性】
技术研发人员:王鑫董浩
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1