基于人工智能构建评论图谱的方法和装置制造方法及图纸

技术编号:16327357 阅读:29 留言:0更新日期:2017-09-29 19:09
本申请公开了基于人工智能构建评论图谱的方法和装置。方法的一具体实施方式包括:基于网络页面中的评论数据,确定评论文本;根据评论文本中的特征,识别评论文本中的评论主体和评论观点;基于评论主体和评论观点,生成包括评论主体、评论观点和情感倾向的主体观点对;基于新闻资讯,生成与主体观点对相关联的评论标签;基于评论标签和主体观点对,生成评论图谱。该实施方式在对外提供评论时,提高了评论的针对性、精准性以及对评论情感的控制,并且由于构建评论图谱的来源丰富,覆盖面广,因此向外提供的评论也反映大多数评论意见,提升了评论图谱的适用范围。

【技术实现步骤摘要】
基于人工智能构建评论图谱的方法和装置
本申请涉及计算机
,具体涉及计算机网络
,尤其涉及基于人工智能构建评论图谱的方法和装置。
技术介绍
人工智能(ArtificialIntelligence,简称AI)技术的快速发展为人们的日常工作和生活提供了便利。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能越来越多地融入到应用中,结合人工智能的应用可以准确地确定出信息的种类,并按照不同用户的需求将不同种类的信息推送给相应的用户。随着人工智能的飞速发展,如何让机器能拥有和人类一样的智能,成了无数企业希望做到的事情。在这个背景下,我们希望机器能够读懂一篇文章,并且能够给出有自己观点的评论,或者给出互联网用户对这篇文章的一般观点。目前的机器评论,一般都是通过传统的信息检索技术,基于新闻关键词索引出相关新闻的评论,并基于新闻与新闻的相关性以及新闻与评论的相关性,选出最相关的评论。然而,目前的机器评论,人云亦云,给出的评论必须是用户已经在相同或者类似新闻中发表的评论,机器本身并不理解新闻的内容和评论的内容,并且由于检索召回的依据是新闻和评论的相关性,普遍存在冷门新闻无法召回的问题,如果放开相关性限制,容易产出不相关的回复,并且严重依赖评论库的时效性,质量以及大小,因此影响面和召回率低。
技术实现思路
本申请的目的在于提出一种改进的基于人工智能构建评论图谱的方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请实施例提供了一种基于人工智能构建评论图谱的方法,方法包括:基于网络页面中的评论数据,确定评论文本;根据评论文本中的特征,识别评论文本中的评论主体和评论观点;基于评论主体和评论观点,生成包括评论主体、评论观点和情感倾向的主体观点对;基于新闻资讯,生成与主体观点对相关联的评论标签;基于评论标签和主体观点对,生成评论图谱。在一些实施例中,基于评论主体和评论观点,生成包括评论主体、评论观点和情感倾向的主体观点对包括:基于评论主体、评论观点以及以下三项中的一项或多项:评论文本的篇章信息、共现信息以及实体类型,提取包括评论主体、评论观点和情感倾向的主体观点对。在一些实施例中,基于新闻资讯,生成与主体观点对相关联的评论标签包括:基于新闻资讯,确定新闻标签;计算新闻标签与评论文本的相关性;将相关性符合预设阈值的新闻标签确定为与主体观点对相关联的评论标签。在一些实施例中,基于新闻资讯,确定新闻标签包括:根据新闻资讯中词语的预定特征,采用权重模型确定词语的权重;基于词语的权重和词语之间的共现特征,确定新闻标签。在一些实施例中,权重模型根据以下步骤确定:获取新闻资讯样本;根据新闻资讯样本中词语的预定特征,采用支持向量机训练权重模型。在一些实施例中,基于新闻资讯,确定新闻标签还包括:从新闻资讯中抽取事件,事件包括事件类型和事件元素;若事件元素中存在事件元素被选为新闻标签,则将事件确定为新闻标签。在一些实施例中,计算新闻标签与评论文本的相关性包括以下一项或多项:根据同义词词典,计算新闻标签中的专名或短语与评论主体的相关性;基于预设的专名对应规则,计算新闻标签中的专名与评论主体的相关性;基于文本深度表示模型,计算由新闻标签中的词语生成的向量与由评论主体生成的向量的相似度;基于文本深度表示模型,计算由事件的词语生成的向量与由评论观点生成向量的相似度;基于文本深度表示模型,计算由新闻标签的词语生成的向量与由评论文本中除主体和观点之外的实义词生成的向量的相似度。在一些实施例中,基于评论标签和评论内容,生成评论图谱包括:将评论标签作为评论图谱的标签节点;将主体观点对作为评论图谱的评论节点;在标签节点和对应标签节点的评论节点之间建立连接关系。在一些实施例中,基于评论标签和评论内容,生成评论图谱还包括:在语义关联的评论节点之间,建立连接关系;和/或在语义相同的标签节点之间,建立连接关系。在一些实施例中,在语义关联的评论节点之间,建立连接关系包括:在语义相同和/或语义相反的评论节点之间,建立连接关系。第二方面,本申请实施例提供了一种生成新闻评论的方法,方法包括:根据新闻资讯中词语的预定特征,采用权重模型确定词语的权重;基于词语的权重和词语之间的共现特征,确定新闻标签;基于新闻标签以及根据如上述的基于人工智能构建评论图谱的方法构建的评论图谱,确定评论图谱中对应新闻标签的主体观点对;基于确定的主体观点对,生成新闻评论。第三方面,本申请实施例提供了一种基于人工智能构建评论图谱的装置,装置包括:评论文本确定单元,用于基于网络页面中的评论数据,确定评论文本;主体观点识别单元,用于根据评论文本中的特征,识别评论文本中的评论主体和评论观点;主体观点对生成单元,用于基于评论主体和评论观点,生成包括评论主体、评论观点和情感倾向的主体观点对;评论标签生成单元,用于基于新闻资讯,生成与主体观点对相关联的评论标签;评论图谱生成单元,用于基于评论标签和主体观点对,生成评论图谱。在一些实施例中,主体观点对生成单元进一步用于:基于评论主体、评论观点以及以下三项中的一项或多项:评论文本的篇章信息、共现信息以及实体类型,提取包括评论主体、评论观点和情感倾向的主体观点对。在一些实施例中,评论标签生成单元包括:新闻标签确定单元,用于基于新闻资讯,确定新闻标签;相关性计算单元,用于计算新闻标签与评论文本的相关性;评论标签确定单元,用于将相关性符合预设阈值的新闻标签确定为与主体观点对相关联的评论标签。在一些实施例中,新闻标签确定单元包括:词语权重确定子单元,用于根据新闻资讯中词语的预定特征,采用权重模型确定词语的权重;新闻标签确定子单元,用于基于词语的权重和词语之间的共现特征,确定新闻标签。在一些实施例中,词语权重确定子单元中的权重模型根据以下步骤确定:获取新闻资讯样本;根据新闻资讯样本中词语的预定特征,采用支持向量机训练权重模型。在一些实施例中,新闻标签确定单元还包括:新闻事件抽取子单元,用于从新闻资讯中抽取事件,事件包括事件类型和事件元素;新闻事件确定子单元,用于若事件元素中存在事件元素被选为新闻标签,则将事件确定为新闻标签。在一些实施例中,相关性计算单元进一步用于以下一项或多项:根据同义词词典,计算新闻标签中的专名或短语与评论主体的相关性;基于预设的专名对应规则,计算新闻标签中的专名与评论主体的相关性;基于文本深度表示模型,计算由新闻标签中的词语生成的向量与由评论主体生成的向量的相似度;基于文本深度表示模型,计算由事件的词语生成的向量与由评论观点生成向量的相似度;基于文本深度表示模型,计算由新闻标签的词语生成的向量与由评论文本中除主体和观点之外的实义词生成的向量的相似度。在一些实施例中,评论图谱生成单元包括:标签节点确定单元,用于将评论标签作为评论图谱的标签节点;评论节点确定单元,用于将主体观点对作为评论图谱的评论节点;标签评论连接单元,用于在标签节点和对应标签节点的评论节点之间建立连接关系。在一些实施例中,评论图谱生成单元本文档来自技高网
...
基于人工智能构建评论图谱的方法和装置

【技术保护点】
一种基于人工智能构建评论图谱的方法,其特征在于,所述方法包括:基于网络页面中的评论数据,确定评论文本;根据所述评论文本中的特征,识别所述评论文本中的评论主体和评论观点;基于所述评论主体和所述评论观点,生成包括所述评论主体、所述评论观点和情感倾向的主体观点对;基于新闻资讯,生成与所述主体观点对相关联的评论标签;基于所述评论标签和所述主体观点对,生成评论图谱。

【技术特征摘要】
1.一种基于人工智能构建评论图谱的方法,其特征在于,所述方法包括:基于网络页面中的评论数据,确定评论文本;根据所述评论文本中的特征,识别所述评论文本中的评论主体和评论观点;基于所述评论主体和所述评论观点,生成包括所述评论主体、所述评论观点和情感倾向的主体观点对;基于新闻资讯,生成与所述主体观点对相关联的评论标签;基于所述评论标签和所述主体观点对,生成评论图谱。2.根据权利要求1所述的方法,其特征在于,所述基于所述评论主体和所述评论观点,生成包括所述评论主体、所述评论观点和情感倾向的主体观点对包括:基于所述评论主体、所述评论观点以及以下三项中的一项或多项:评论文本的篇章信息、共现信息以及实体类型,提取包括所述评论主体、所述评论观点和情感倾向的主体观点对。3.根据权利要求1所述的方法,其特征在于,所述基于新闻资讯,生成与所述主体观点对相关联的评论标签包括:基于新闻资讯,确定新闻标签;计算所述新闻标签与所述评论文本的相关性;将所述相关性符合预设阈值的新闻标签确定为与所述主体观点对相关联的评论标签。4.根据权利要求3所述的方法,其特征在于,所述基于新闻资讯,确定新闻标签包括:根据所述新闻资讯中词语的预定特征,采用权重模型确定词语的权重;基于所述词语的权重和所述词语之间的共现特征,确定新闻标签。5.根据权利要求4所述的方法,其特征在于,所述权重模型根据以下步骤确定:获取新闻资讯样本;根据所述新闻资讯样本中词语的所述预定特征,采用支持向量机训练权重模型。6.根据权利要求4所述的方法,其特征在于,所述基于所述新闻资讯,确定新闻标签还包括:从新闻资讯中抽取事件,所述事件包括事件类型和事件元素;若所述事件元素中存在事件元素被选为所述新闻标签,则将所述事件确定为所述新闻标签。7.根据权利要求3所述的方法,其特征在于,所述计算新闻标签与所述评论文本的相关性包括以下一项或多项:根据同义词词典,计算所述新闻标签中的专名或短语与所述评论主体的相关性;基于预设的专名对应规则,计算所述新闻标签中的专名与所述评论主体的相关性;基于文本深度表示模型,计算由所述新闻标签中的词语生成的向量与由所述评论主体生成的向量的相似度;基于文本深度表示模型,计算由所述事件的词语生成的向量与由所述评论观点生成向量的相似度;基于文本深度表示模型,计算由所述新闻标签的词语生成的向量与由所述评论文本中除所述主体和所述观点之外的实义词生成的向量的相似度。8.根据权利要求1至7任意一项所述的方法,其特征在于,所述基于所述评论标签和评论内容,生成评论图谱包括:将所述评论标签作为所述评论图谱的标签节点;将所述主体观点对作为所述评论图谱的评论节点;在所述标签节点和对应所述标签节点的所述评论节点之间建立连接关系。9.根据权利要求8所述的方法,其特征在于,所述基于所述评论标签和评论内容,生成评论图谱还包括:在语义关联的所述评论节点之间,建立连接关系;和/或在语义相同的所述标签节点之间,建立连接关系。10.根据权利要求9所述的方法,其特征在于,所述在语义关联的所述评论节点之间,建立连接关系包括:在语义相同和/或语义相反的所述评论节点之间,建立连接关系。11.一种生成新闻评论的方法,其特征在于,所述方法包括:根据新闻资讯中词语的预定特征,采用权重模型确定词语的权重;基于所述词语的权重和所述词语之间的共现特征,确定新闻标签;基于所述新闻标签以及根据如权利要求1-10任意一项所述的基于人工智能构建评论图谱的方法构建的评论图谱,确定所述评论图谱中对应所述新闻标签的主体观点对;基于确定的主体观点对,生成新闻评论。12.一种基于人工智能构建评论图谱的装置,其特征在于,所述装置包括:评论文本确定单元,用于基于网络页面中的评论数据,确定评论文本;主体观点识别单元,用于根据所述评论文本中的特征,识别所述评论文本中的评论主体和评论观点;主体观点对生成单元,用于基于所述评论主体和所述评论观点,生成包括所述评论主体、所述评论观点和情感倾向的主体观点对;评论标签生成单元,用于基于新闻资讯,生成与所...

【专利技术属性】
技术研发人员:时迎超崔建青和为
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1