【技术实现步骤摘要】
舆情关联方法、装置、可读存储介质及电子设备
[0001]本专利技术涉及数据处理
,具体涉及一种舆情关联方法、装置、可读存储介质及其电子设备。
技术介绍
[0002]在企业详情页的舆情板块中,用户希望可以通过该舆情板块了解到一家企业近期发生的事件、新闻等。为了使用户及时了解该企业对应舆情新闻中的关键信息,需要将存在关键信息的舆情与企业对应,以供用户直观了解企业存在的正向信息和风险信息。然而互联网时代存在大量的舆情新闻,包括正面舆情和负面舆情,现有技术中并没有针对舆情新闻的关键信息进行筛选,就仅通过模型简单的对舆情中的实体进行识别,这样不仅存在企业与舆情对应错误的情况,而且也会将一些无关紧要的舆情新闻与其关系不大的实体进行关联;此外,当舆情新闻中出现多个实体的情况时,现有技术并不能准确判断出该舆情新闻所表达的语义倾向对应于多个实体中的哪个,从而无法与其对应的实体进行准确关联,导致风险信息的可信度低,给用户带来了诸多不便。由此可见,如何准确地将舆情与实体进行关联成为当前亟待解决的技术问题。
技术实现思路
[0 ...
【技术保护点】
【技术特征摘要】
1.一种舆情关联方法,其特征在于,所述方法包括:获取舆情文本;获取所述舆情文本中的多个实体;确定所述舆情文本与所述多个实体中的每个实体对应的信息标签;基于确定的所述信息标签,将所述舆情文本与所述信息标签对应的实体关联,以使用户通过所述实体对应的所述信息标签获取到舆情信息。2.根据权利要求1所述的方法,其特征在于,所述获取所述舆情文本中的多个实体,具体包括:根据预设方式将所述舆情文本进行分句得到多个语句;对所述多个语句中的每个语句根据句子构成方式进行分词;根据分词结果中所述每个语句的谓语动词确定所述每个语句中出现的企业实体;将确定的所有企业实体作为所述舆情文本中的多个实体。3.根据权利要求2所述的方法,其特征在于,所述根据预设方式将所述舆情文本进行分句得到多个语句,具体包括:响应于舆情文本为中文文本,根据最终标识符对所述舆情文本进行分句得到多个语句;响应于舆情文本为英文文本,根据预设标号和大写字母的组合方式对所述舆情文本进行分句得到多个语句。4.根据权利要求2所述的方法,其特征在于,所述将确定的所有企业实体作为所述舆情文本中的多个实体之后,还包括:确定所述多个实体中的各个实体在所述舆情文本中以所述第一人称视角出现的频次;基于所述各个实体在所述舆情文本中以所述第一人称视角出现的频次,确定与所述舆情相关的最终实体。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:使用垃圾语料词集合,判断所述舆情文本的质量;若根据所述舆情文本的质量确定所述舆情文本为垃圾舆情,则对所述舆情文本执行过滤处理;若根据所...
【专利技术属性】
技术研发人员:庞世娜,
申请(专利权)人:北京金堤科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。