【技术实现步骤摘要】
文本分析方法及装置
本专利技术涉及互联网
,尤其涉及一种文本分析方法及装置。
技术介绍
现阶段,随着网络的发展,网络文章也越来越多。每个文章都有一定的关注点,并在文章中表达对该关注点的情感倾向。文本情感倾向,表示一段文本的情感倾向和感情色彩。情感倾向可以是积极的、消极的、中性的,也可以是具体的情感,例如喜悦、愤怒、痛苦等。文本情感倾向分析是情感分析研究的重要组成部分,其在话题监控、产品口碑分析、舆情分析等领域具有十分重要的研究和应用价值。新闻文本是当前网络上最为常见的一种特殊的文本形式,其情感分析也具备很多特殊性。新闻文本通常由多个新闻关注点以及对该关注点的描述构成。不同的新闻作者对于关注点的情感倾向也存在差异。
技术实现思路
本专利技术实施例提供一种文本分析方法及装置,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种文本分析方法,包括:获取文本的关注点;根据所述关注点,获取所述文本中关于所述关注点的子句集合;根据所述子句集合,获得关于所述关注点的子句情感倾向分类;根据所述情感倾向分类,获得关于所述关注点的情感倾向。在一种实施方式中,根 ...
【技术保护点】
1.一种文本分析方法,其特征在于,包括:获取文本的关注点;根据所述关注点,获取所述文本中关于所述关注点的子句集合;根据所述子句集合,获得关于所述关注点的子句情感倾向分类;根据所述情感倾向分类,获得关于所述关注点的情感倾向。
【技术特征摘要】
1.一种文本分析方法,其特征在于,包括:获取文本的关注点;根据所述关注点,获取所述文本中关于所述关注点的子句集合;根据所述子句集合,获得关于所述关注点的子句情感倾向分类;根据所述情感倾向分类,获得关于所述关注点的情感倾向。2.根据权利要求1所述的方法,其特征在于,根据所述关注点,获取文本中关于所述关注点的子句集合,包括:提取文本中关于所述关注点的候选子句;若所述候选子句包含所述关注点,则将所述候选子句加入所述关注点的子句集合;若所述候选子句包含指示代词,则对所述候选子句进行指代消解,获得修正后的候选子句;若所述修正后的候选子句包含所述关注点,则将所述修正后的候选子句加入所述关注点的子句集合。3.根据权利要求2所述的方法,其特征在于,对所述候选子句进行指代消解包括:采用监督分类模型或者依据预设规则,对所述候选子句进行指代消解。4.根据权利要求1所述的方法,其特征在于,获取文本的关注点,包括:获取所述文本的关注点集合;对所述关注点集合中的元素进行归一化,获得所述文本的关注点。5.根据权利要求4所述的方法,其特征在于,获取所述文本的关注点集合,包括:对所述文本进行搜索查询,获得关注点集合的元素;或,抽取所述文本子句中的实体,得到候选项,对所述候选项进行计算,获得关注点集合包括的各元素。6.根据权利要求1所述的方法,其特征在于,根据所述子句集合,获得关于所述关注点的子句情感倾向分类,包括:利用情感倾向分析模型,学习所述子句的分词嵌入到向量空间中的向量表示;将所述子句的所有分词的向量表示拼接,获得所述子句的拼接向量表示;根据所述拼接向量表示,获得所述子句的情感倾向分类。7.根据权利要求6所述的方法,其特征在于,所述情感倾向分析模型基于长短期记忆LSTM模型或者卷积神经网络CNN构建。8.一种文本分析装置,其特征在于,包括:关注点获取模块:用于获取文本的关注点;子句集合获取模块:用于根据所述关注点,获取所述文本中关于所述关注点的子句集合;情感倾向分类获取模块:用于根据所述子句集合,获得关于所述关注点的子句情感倾向分类;情感倾向获取模块:用于根据所述情感倾向分类,获得关于...
【专利技术属性】
技术研发人员:刘昊,何伯磊,肖欣延,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。