当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于在线社交平台群聊数据对群成员进行关联的系统及方法技术方案

技术编号:14116714 阅读:83 留言:0更新日期:2016-12-07 23:02
本发明专利技术公开了一种基于在线社交平台中的群聊数据对群成员进行关联的方法和系统,属于信息技术领域。该方法包括:获取并分析群聊数据,对群聊信息做处理并抽取出能够表征群成员交互行为的群聊特征;分析在线社交网络中群聊信息的语篇情境,并根据不同的语篇情境设计不同的启发式规则来判断群成员之间是否具有交流行为;遍历群聊数据并根据群聊片段所处的语篇情境,选择相应的启发式规则判断消息片段之间是否具有交流关系,并根据交流行为的密切程度赋予相应权重;将群成员的关联关系以图论的形式可视化的展示出来。本发明专利技术弥补了现有技术中根据群聊内容关联群成员技术的缺失。

【技术实现步骤摘要】

本专利技术涉及信息
,尤其涉及一种基于在线社交平台群聊数据对群成员进行关联的系统及方法
技术介绍
在线社交软件的发展,极大地方便了人们之间的联系。人们之间的沟通更多的借助于在线社交软件提供的平台,廉价、快速的交换消息,从而免去了线下交流带来的不便。目前,在线社交平台提供的消息交换形式主要分为两种,一种是点对点形式,另一种是群组聊天形式。在点对点消息交互中,用户之间的关系简单明确,交流行为可以明确判定,因此可以很容易根据用户之间是否有消息交互行为,交互频率等特征将两个用户进行关联。但是,在群聊形式中,用户(即群成员)之间的交互行为并没有类似点对点形式中清晰明确的判定方法。例如,(1)群组中多个群成员之间交叉发言,某一个成员的某条回复可能是同时对多个群成员的回应,也可能只是对之前某个群成员的回应,需要判定群聊中每条发言内容是对哪些发言内容的回复;(2)群聊内容多为短文本,并且带有很强的口语化特征,在判定两个文本之间的相似性的时候不太适用长文本的计算方法。(3)某个群成员可能在群中是消息的发布者而其他成员是消息的接收者,需要找到一种方法能区分出发布者和接收者。群聊的上述特征使得群组成员间的关联关系较难判断。
技术实现思路
专利技术目的:针对现有技术解决上述问题,本专利技术提出了一种基于在线社交平台的群聊数据对群成员进行关联的方法和系统。本方法和系统能够基于群成员在群组内的发言内容、发言时间等特征,判断群中哪些成员之间的具有交流关系以及交流密切程度,并据此将群组中交互关系密切的成员进行关联,最后以可视化的方式展现关联关系以及关联密切程度。技术方案:一种基于在线社交平台群聊数据对群成员进行关联的方法,包括以下步骤:步骤1:获取并分析在线社交平台的群聊数据,对群聊消息做处理并抽取出表征群成员交互行为的群聊特征;步骤2:分析在线社交网络中群聊消息的语篇情境,并根据不同的语篇情境设计不同的启发式规则来判断群成员之间是否具有交流行为;步骤3:遍历群聊数据,根据群聊片段所处的语篇情境,选择相应的启发式规则判断消息片段之间是否具有交流关系,并根据交流行为的密切程度赋予消息发送成员之间相应权重。在该步骤中,依据时间先后顺序遍历群聊数据,每次选择群中不同群成员所发表的两条消息,然后根据启发式规则判断这两条消息处于何种语篇情境下,接着根据不同的语篇情境选择相应的启发式规则来判断这两条消息片段之间是否具有交流行为。若判断为有交流行为,则计算这两条发言片段之间的关联程度的权重值,同时查找发布这两条发言片段的两个群成员之间是否有关联关系,若群成员之间没有关联关系,则将这两个群成员之间添加关联关系,并将消息关联程度的权重值赋予此关联关系,作为群成员之间的关联程度;若群成员之间已经具有关联关系,则将消息关联程度的权重赋予值累加到原先的权重值中,更新关联权重值。最后通过遍历所有不同群成员之间所发的所有消息来确定不同群成员之间是否具关联关系以及关联强弱程度。所述步骤1中所获取的在线社交平台的群聊数据包含了一个或者多个群的全部群聊数据或者其在某个时间段内的群聊数据,所述群聊数据包括:群成员信息、群聊消息的发送方、群聊消息的发送时间、群聊消息的具体内容。所述步骤1中对群聊消息进行处理的方法具体包括:将所获取的群聊数据进行清洗与预处理,剔除非群成员发布的消息;拆分群聊内容,将每个群成员的每一条发言行为的发言时间、发言内容作为一条单独的待分析数据保存。所述步骤1中所抽取的表征群成员交互行为的群聊特征具体包括如下六种:直接提名特征、时序特征、对话密度特征、文本相似性特征、回应词特征、非文本类数据特征。所述步骤2具体包括:分析并归纳在线群聊内容中出现的不同语篇情境,并设计如下三种启发式规则:应答语篇情境下启发式规则、孤立语篇情境下启发式规则和其他语篇情境下启发式规则。每种规则都会选择不同的群聊交互特征,组合并赋予每种特征一定的权重来综合判定两条不同消息片段之间是否具有交流关系,同时能判定交流关系强弱。所述每种启发式规则都选择不同的群聊群成员交互行为特征,组合并赋予每种特征一定的权重来综合判定两条不同消息片段之间是否具有交流关系,同时能判定交流关系强弱。一种基于在线社交平台群聊数据对群成员进行关联的系统,包含以下模块:群聊数据获取模块,用于获取某个群或某些群的全部群聊消息或者在某个时间跨度内的群聊消息,并将获取的群聊数据保存在本地存储模块中以待分析;群成员关联关系计算模块,用于计算待分析群组中成员之间的关联关系,同时将计算所得的关联关系结果保存在数据库中;群成员关联关系可视化模块,用于将群成员之间的关联关系用网络的方式展现出来;该模块根据群成员关联关系计算模块中计算得到的关联消息,将群成员之间的关联关系用网络的方式可视化的展现出来。其中,不同群成员用不同的点表示,群成员之间的关联关系用有向边来表示。本地存储模块,用于存储群聊数据以及群成员关联关系数据。所述群聊数据获取模块将获取的群聊数据保存在本地存储模块;所述群成员关联关系计算模块从本地存储模块中取群聊数据加以分析计算,并将计算得到的群成员关联关系存储到本地存储模块中;所述群成员关联关系可视化模块从本地存储模块或者群成员关联关系计算模块中取群成员关联关系数据,并加以可视化。有益效果:相对于现有技术,本专利技术通过分析群的群聊内容来将群中具有交流行为的群成员之间建立关联关系,并能通过权重区分不同群成员之间关联程度强弱,最后通过可视化模块将群成员之间的相互关联关系展示出来。本专利技术弥补了现有技术中根据群聊内容关联群成员技术的缺失,并且能快速分析群成员之间的关联关系。附图说明图1为本专利技术的系统结构示意图;图2为本专利技术的方法流程图;图3为本专利技术的方法中步骤1的具体步骤流程图;图4为本专利技术的方法中步骤3的具体步骤流程图;图5为本专利技术的实施例一的具体实施方法步骤流程图;图6为本专利技术的群成员关联关系可视化展示方式示例图。具体实施方式下面将结合附图,对本专利技术的实施案例进行详细的描述;图1所示的是本专利技术的系统结构示意图,该图描述了本系统的组成模块以及每个模块之间的联系。本系统由群聊数据获取模块1、本地存储模块2、群成员关联关系计算模块3、群成员关联关系可视化模块4组成。以下具体介绍每个模块的作用以及模块之间的配合关系。群聊数据获取模块1。该模块可以根据待分析需求,选择从社交服务提供商平台的服务器端或者数据库中提取出某个群或者某些群的完整聊天记录,或者在某个时间段内的聊天记录,该模块取得的群聊数据存入本地存储模块2中,以待进一步分析处理群聊内容。本地存储模块2。该模块用于保存从群聊数据获取模块1中取得的群聊内容,或者保存群成员关联关系计算模块3中计算所得的群成员关联关系数据。群成员关联关系计算模块3。该模块从本地存储模块2中提取需要分析的群成员的群聊内容,然后用本专利技术中提出的基于在线社交平台群聊数据对群成员进行关联的方法,计算群成员之间的关联关系,所得结果保存在本地存储模块2中,并且可以同时传送给群成员关联关系可视化模块4。群成员关联关系可视化模块4。该模块可以从本地存储模块2中取得已经完成的群成员关联关系数据并加以可视化;也可以直接接受群成员关联关系计算模块计算得到的数据并加以可视化。该系统的各个模块之间的配合流程为:群本文档来自技高网...
一种基于在线社交平台群聊数据对群成员进行关联的系统及方法

【技术保护点】
一种基于在线社交平台群聊数据对群成员进行关联的方法,其特征在于,包括以下步骤:步骤1:获取并分析在线社交平台的群聊数据,对群聊消息做处理并抽取出表征群成员交互行为的群聊特征;步骤2:分析在线社交网络中群聊消息的语篇情境,并根据不同的语篇情境设计不同的启发式规则来判断群成员之间是否具有交流行为;步骤3:遍历群聊数据,根据群聊片段所处的语篇情境,选择相应的启发式规则判断消息片段之间是否具有交流关系,并根据交流行为的密切程度赋予消息发送成员之间相应权重。

【技术特征摘要】
1.一种基于在线社交平台群聊数据对群成员进行关联的方法,其特征在于,包括以下步骤:步骤1:获取并分析在线社交平台的群聊数据,对群聊消息做处理并抽取出表征群成员交互行为的群聊特征;步骤2:分析在线社交网络中群聊消息的语篇情境,并根据不同的语篇情境设计不同的启发式规则来判断群成员之间是否具有交流行为;步骤3:遍历群聊数据,根据群聊片段所处的语篇情境,选择相应的启发式规则判断消息片段之间是否具有交流关系,并根据交流行为的密切程度赋予消息发送成员之间相应权重。2.根据权利要求1所述的基于在线社交平台群聊数据对群成员进行关联的方法,其特征在于,所述步骤1中所获取的在线社交平台的群聊数据包含了一个或者多个群的全部群聊数据或者其在某个时间段内的群聊数据,所述群聊数据包括:群成员信息、群聊消息的发送方、群聊消息的发送时间、群聊消息的具体内容。3.根据权利要求1所述的基于在线社交平台群聊数据对群成员进行关联的方法,其特征在于,所述步骤1中对群聊消息进行处理的方法具体包括:将所获取的群聊数据进行清洗与预处理,剔除非群成员发布的消息;拆分群聊内容,将每个群成员的每一条发言行为的发言时间、发言内容作为一条单独的待分析数据保存。4.根据权利要求1所述的基于在线社交平台群聊数据对群成员进行关联的方法,其特征在于,所述步骤1中所抽取的表征群成员交互行为的群聊特征具体包括如下六种:直接提名特征、时序特征、对话密度特征、文本相似性特征、回应词特征、非文本类数据特征。5.根据权利要求1所述的基...

【专利技术属性】
技术研发人员:刘肖凡李正龙
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1