【技术实现步骤摘要】
一种舆情文本展示方法和装置
[0001]本专利技术涉及计算机
,具体地,涉及一种舆情文本展示方法和装置。
技术介绍
[0002]在实际应用场景中,会产生各种与对象相关的舆情文本,这些舆情文本通常与对象关联展示。
[0003]现有技术将与对象相关的所有舆情文本均与该对象关联展示,例如,舆情文本A、B、C、D均与企业1相关,将A、B、C、D均与企业1关联展示。
[0004]但是,不同媒体发布的舆情文本可能存在相同或相似度比较高的情况,导致展示的舆情文本较为冗余,例如,舆情文本A由媒体1发布,舆情文本B是由媒体2发布,舆情文本B是由舆情文本A转载获得,两者的内容相同,但是均与企业1关联展示。
技术实现思路
[0005]本专利技术的目的是提供一种舆情文本展示方法和装置,以解决相关技术中存在的问题。
[0006]第一方面,本专利技术实施例提供一种舆情文本展示方法,所述方法包括:
[0007]获取目标舆情文本;
[0008]对所述目标舆情文本进行分词,根据得到的若干分词结果, ...
【技术保护点】
【技术特征摘要】
1.一种舆情文本展示方法,其特征在于,包括:获取目标舆情文本;对所述目标舆情文本进行分词,根据得到的若干分词结果,生成目标特征向量;从所述目标舆情文本中提取与目标对象关联的若干目标实体;查询预设的舆情文本库中是否包含与所述若干目标实体关联的候选舆情文本;其中,所述舆情文本库中存储舆情文本及其关联的实体;根据查询结果和所述目标特征向量,识别所述目标舆情文本是否与所述舆情文本库中的舆情文本相似;根据所述识别结果,确定是否展示与所述目标对象关联的目标舆情文本。2.根据权利要求1所述的方法,其特征在于,所述根据得到的若干分词结果,生成目标特征向量,包括:根据所述若干分词结果和预设的窗口尺寸,生成若干词组;根据所述若干词组,生成共现矩阵;其中,所述共现矩阵的元素为同时包含所述元素的行值和列值的词组的数量;根据所述共现矩阵,生成所述目标特征向量。3.根据权利要求2所述的方法,其特征在于,所述根据所述共现矩阵,生成所述目标特征向量,包括:根据所述共现矩阵,确定各个所述分词结果的特征向量及其权重;根据各个所述分词结果的特征向量及其权重,确定所述目标特征向量。4.根据权利要求2或3所述的方法,其特征在于,所述根据查询结果和所述目标特征向量,识别所述目标舆情文本是否与所述舆情文本库中的舆情文本相似,包括:响应于所述舆情文本库中包含多个所述候选舆情文本,获取各个所述候选舆情文本的特征向量;针对每个所述候选舆情文本:根据所述目标特征向量和所述候选舆情文本的特征向量,确定所述目标舆情文本是否与所述候选舆情文本相似。5.根据权利要求1所述的方法,其特征在于,所述根据查询结果和所述目标特征向量,识别所述目标舆情文本是否与所述舆情文本库中的舆情文本相似,包括:响应于所述舆情文本库中不包含所述候选舆情文本,获取所述目标舆情文本的发布时间,根据所述目标舆情文本的发布时间,从所述舆情文本库中筛选出发布时间间隔小于设定时间间隔的待识别舆情文本,获取各个所述待识别舆情文本的特征向量;针对每个所述待识别舆情文本:根据所述目标特征向量和所述待识别舆情文本的特征向量,确定所述目标舆情文本是否与所述候选舆情文本相似。6.根据权利要求1或5所述的方法,其特征在于,所述舆情文本库中包含与所述若干目标实体关联的候选舆情文本;所述根据所述识别结果,确定是否展示与所述目标对象关联的目标舆情文本,包括:响应于所述目标舆情文本与所述候选舆情文本...
【专利技术属性】
技术研发人员:刘阳,
申请(专利权)人:北京金堤科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。