Analysis method and device of the invention discloses a public opinion event entity, relates to the technical field of the Internet, the purpose is to solve the public opinion monitoring system can accurately analyze the public opinion events involved in people and institutions, the cause of the user can not produce accurate positioning of the public opinion monitoring system of public opinion events, leading to not timely determine the best way to lead the problem of public opinion events. The method includes: obtaining information collection, information collection and segmentation of the characters in the collection; entity extraction after word segmentation information and entity; statistics were co - mention number, character entity mention times and entity mentions; according to the relationship between the number of identified common mentioned character entities and entities determined; according to the relationship between character entity mention times and / or entity between the number mentioned, character entities and entity of public opinion event entities and relations. The invention is applied to monitor public opinion events.
【技术实现步骤摘要】
舆情事件实体的分析方法及装置
本专利技术涉及互联网
,特别是涉及一种舆情事件实体的分析方法及装置。
技术介绍
舆情是舆论情况的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。在实际应用中,常通过舆情监控系统对舆情进行监控。舆情监控系统对舆情进行监控的具体过程如下:获取互联网海量信息,对该海量信息进行分类聚类、按词通计、专题聚焦等操作,形成简报、报告、图表等分析结果;实现用户的互联网舆情监测和新闻专题追踪等信息需求,为用户全面掌握网民的思想动态,做出正确舆论引导,提供分析依据。目前,舆情监控系统在对舆情进行分析时,能够分析出该舆情属于什么事件、该舆情事件的发展趋势、该舆情事件涉及的地域等信息,少数舆情监控系统还能分析出网民对该舆情事件所持有的态度;而人物和机构绝大多数情况下是舆情事件产生的主体,但是,舆情监控系统不能准确分析出该舆情事件所涉及的人物和机构,导致用户不能通过舆情监控系统准确定位舆情事件产生的源头,从而导致不能及时确定解决该舆情事件的最佳引导方式。
技术实现思路
有鉴于此,本专利技术提供的一种舆情事件实体的分析方法及装置,主要目的在于解决舆情监控系统不能准确分析出该舆情事件所涉及的人物和机构,导致用户不能通过舆情监控系统准确定位舆情事件产生的源头,从而导致不能及时确定解决该舆情事件的最佳引导方式的问题。为了解决上述问题,本专利技术 ...
【技术保护点】
一种舆情事件实体的分析方法,其特征在于,包括:获取信息集合,并对所述信息集合进行分词;所述信息集合由N个句子组成,其中,N为大于0的整数;提取分词后的所述信息集合中的人物实体及机构实体;分别统计共同提及次数、人物实体提及次数以及机构实体提及次数,其中,所述共同提及次数为在同一个句子中共同提及人物实体与机构实体的次数;根据所述共同提及次数确定所述人物实体与机构实体之间的关联关系;根据所述人物实体提及次数和/或所述机构实体提及次数、所述人物实体与机构实体之间的关联关系确定舆情事件实体及实体关系。
【技术特征摘要】
1.一种舆情事件实体的分析方法,其特征在于,包括:获取信息集合,并对所述信息集合进行分词;所述信息集合由N个句子组成,其中,N为大于0的整数;提取分词后的所述信息集合中的人物实体及机构实体;分别统计共同提及次数、人物实体提及次数以及机构实体提及次数,其中,所述共同提及次数为在同一个句子中共同提及人物实体与机构实体的次数;根据所述共同提及次数确定所述人物实体与机构实体之间的关联关系;根据所述人物实体提及次数和/或所述机构实体提及次数、所述人物实体与机构实体之间的关联关系确定舆情事件实体及实体关系。2.根据权利要求1所述的方法,其特征在于,根据所述共同提及次数确定人物实体与机构实体之间的关联关系包括:获取各人物实体与机构实体对应的共同提及次数,并对所述共同提及次数进行降序排列;确定所述共同提及次数最多的人物实体与机构实体,并确定所述人物实体与机构实体之间的关联关系。3.根据权利要求2所述的方法,其特征在于,根据所述人物实体提及次数和/或所述机构实体提及次数、所述人物实体与机构实体之间的关联关系确定舆情事件的实体及实体关系包括:获取所述人物实体提及次数及机构实体提及次数,并分别对所述人物实体提及次数及机构实体提及次数进行降序排列;确定第一最大值与第二最大值,并将所述第一最大值与所述第二最大值进行比对;其中,所述第一最大值为所述人物实体提及次数的最大值,所述第二最大值为所述机构实体提及次数的最大值;若所述第一最大值大于或者等于所述第二最大值,则根据所述第一最大值对应的所述人物实体确定所述人物实体与机构实体之间的关联关系;将所述人物实体确定为所述舆情事件实体,将确定的所述人物实体与机构实体之间的关联关系确定为所述舆情事件的实体关系。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述第一最大值小于所述第二最大值,则根据所述第二最大值对应的所述机构实体确定所述人物实体与机构实体之间的关联关系;将所述机构实体确定为所述舆情事件实体,将确定的所述人物实体与机构实体之间的关联关系确定为所述舆情事件的实体关系。5.根据权利要求1-4中任一项所述的方法,其特征在于,在提取分词后的所述信息集合中的人物实体及机构实体之后,所述方法还包括:获取预设人物机构数据库;所述预设人物机构数据库用于存储人物实体及机构实体;基于所述预设人物机构数据库对提取的人物实体及机构实体进行校验。6.一种舆情事件实体的分析装置,其特征在于,包括:第一获取单元,用于获取信息集合;所述信息集合由N个句子组成,其中,N为大于0的整数;分词单元,用于对所述第一获取单元获取的所述信息集合进行分词;提取单元,用于提取所述分词单元分词后的所述信息集合中的人物实体及机构实体;统计单元,用于分别统计所述提取单元提...
【专利技术属性】
技术研发人员:冯鸳鹤,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。