一种具有分析对象指向性的文本情感判别方法技术

技术编号:26066649 阅读:21 留言:0更新日期:2020-10-28 16:39
本发明专利技术公开了一种具有分析对象指向性的文本情感判别方法,包括步骤:S001,输入文本内容和分析对象核心词;S002,分析对象核心词对输入的文本内容进行二次文本提取,提取文本内容中关于分析对象的指向性文本;S003,对提取的指向性文本进行情感判断,输出情感判断结果。本发明专利技术的情感判断针对同一文本内容,会进行二次文本提取,使最终进行情感判断的文本与分析对象有强相关性;情感判断针对同一文本内容,如有多个分析对象,将输出多个分析对象各自的情感判断结果;通过区分不同分析对象的视角,使情感判断结果具备指向性,消除因为分析视角不同带来的情感误判,从而提升情感判断的准确率。

【技术实现步骤摘要】
一种具有分析对象指向性的文本情感判别方法
本专利技术涉及计算机文本处理
,特别是一种具有分析对象指向性的文本情感判别方法。
技术介绍
文本情感判别是现有计算机统计分析文本中关于分析对象的情感意向的算法方式,用于归纳评价分析对象的情感判别结果,在实际应用中,文本中其关键性作用的实际上是文本中的指向性文本内容。分析对象是指文本中描述的主体,一般代指文本数据采集中的采集对象,包括但不局限于品类、品牌、产品、活动、明星代言人等;指向性是指文本内容中与分析对象相关的内容;文本情感判别对文本内容通过算法判断为正面、中性或负面。现有文本情感判别算法主要是针对文本整体进行情感判断,会有以下缺陷:1)文本相关性低,影响最终情感判别结果;2)同一条文本中提及多个分析对象时,没有区分不同分析对象的情感判断。
技术实现思路
本专利技术针对上述问题,提供一种具有分析对象指向性的文本情感判别方法,包括以下步骤:一种具有分析对象指向性的文本情感判别方法,其特征在于:包括以下步骤:S001,输入文本内容和分析对象核心词,所述文本内容至少包含了分析对象的指向性文本,在计算识别过程中以这些指向性文本为基础可以使情感判断与分析对象具有较强的相关性。S002,以上述步骤中的分析对象核心词对输入的文本内容进行二次文本提取,提取文本内容中关于分析对象的指向性文本。S003,对提取的指向性文本进行情感判断,输出情感判断结果。作为本专利技术的进一步说明,所述文本内容为包含单段落或多段落的文档。>更进一步地,所述步骤S001中批量输入文本内容时,每个文本内容逐一处理。更进一步地,所述分析对象由人工设定,例如品类、品牌、产品、活动、明星代言人等。更进一步地,与所述分析对象对应的分析对象核心词为一个或多个。更进一步地,所述步骤S002中的二次文本提取为对文本内容进行分析对象核心词的匹配,将分析对象核心词所在分句提取到所述指向性文本上。更进一步地,所述指向性文本采用缓存的方式存储。更进一步地,所述步骤S003输出的情感判断结果与所述文本内容中包含的分析对象数量对应。本专利技术的有益效果:本专利技术的情感判断针对同一文本内容,会进行二次文本提取,使最终进行情感判断的文本与分析对象有强相关性;情感判断针对同一文本内容,如有多个分析对象,将输出多个分析对象各自的情感判断结果;通过区分不同分析对象的视角,使情感判断结果具备指向性,消除因为分析视角不同带来的情感误判,从而提升情感判断的准确率。附图说明图1为本专利技术方法的整体流程图。具体实施方式下面结合附图对本专利技术的具体实施例详细的说明,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。如图1所示的一种具有分析对象指向性的文本情感判别方法的整体流程图,包括以下步骤:S001,输入文本内容和分析对象核心词。作为文本情感判别的基础,所述文本内容至少包含了分析对象的指向性文本,在计算识别过程中以这些指向性文本为基础可以使情感判断与分析对象具有较强的相关性。所述文本内容为包含单段落或多段落的文档,输入时可以是单文本输入,也可以批量输入多个文本,批量输入时每个文本单独处理。此外,与所述分析对象对应的分析对象核心词为一个或多个。S002,以上述步骤中的分析对象核心词对输入的文本内容进行二次文本提取,提取文本内容中关于分析对象的指向性文本。二次文本提取的方式是对文本内容进行核心词的匹配,然后将核心词所在分句提取到所述指向性文本上,所述指向性文本在数据处理中属于中间文本,为了减少系统的存储量,所述指向性文本可以采用缓存的方式暂时存储,带数据处理完成后进行删除,节约存储空间。S003,对提取的指向性文本进行情感判断,输出情感判断结果;如有多个分析对象,将输出多个分析对象各自的情感判断结果。对提取的指向性文本进行情感判断的算法与现有文本情感判别算法相同,例如针对分句每个词的词性进行判别,在训练好的模型中计算出该分句整体的情感偏向及概率,即可得出该分句的情感判断结果,即判断其属于正面、中性或负面中的哪一种,并进行情感判断结果输出。以上仅就本专利技术较佳的实施例作了说明,但不能理解为是对权利要求的限制。本专利技术不仅局限于以上实施例,其具体结构允许有变化,总之,凡在本专利技术独立权利要求的保护范围内所作的各种变化均在本专利技术的保护范围内。本文档来自技高网...

【技术保护点】
1.一种具有分析对象指向性的文本情感判别方法,其特征在于:包括以下步骤:/nS001,输入文本内容和分析对象核心词;/nS002,以上述步骤中的分析对象核心词对输入的文本内容进行二次文本提取,提取文本内容中关于分析对象的指向性文本;/nS003,对提取的指向性文本进行情感判断,输出情感判断结果。/n

【技术特征摘要】
1.一种具有分析对象指向性的文本情感判别方法,其特征在于:包括以下步骤:
S001,输入文本内容和分析对象核心词;
S002,以上述步骤中的分析对象核心词对输入的文本内容进行二次文本提取,提取文本内容中关于分析对象的指向性文本;
S003,对提取的指向性文本进行情感判断,输出情感判断结果。


2.根据权利要求1所述的具有分析对象指向性的文本情感判别方法,其特征在于:所述文本内容为包含单段落或多段落的文档。


3.根据权利要求1所述的具有分析对象指向性的文本情感判别方法,其特征在于:所述步骤S001中批量输入文本内容时,每个文本内容逐一处理。


4.根据权利要求1所述的具有分析对象指向性的文本情感判别方法,其特征在于:所述分析对象由...

【专利技术属性】
技术研发人员:徐亚波李旭日
申请(专利权)人:广州数说故事信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1