The invention discloses a method for processing information communication based on software, it includes the method includes: obtaining S1 within a preset time, the communication between the communication group of users: text information; S2 will gain access to the text information is segmented; S3: by matching the text information and the segmented corpus according to the results, matching feature vectors; S4: the feature vector of the polymerization degree of polymerization is greater than the preset value of text information. The beneficial effect was obtained. The text information is segmented, and corpus matching, feature vectors, feature vectors to generate the polymerization degree of polymerization is greater than the preset value, the frequency is greater than a certain value of the text information; without manual screening of high frequency information, improve work efficiency.
【技术实现步骤摘要】
一种基于通讯软件的信息处理方法
本专利技术涉及信息处理
,特别是一种基于通讯软件的信息处理方法。
技术介绍
随着计算机技术的发展,人们越来越习惯于使用计算机网络进行通讯交流。而在使用计算机网络进行通讯交流时,往往通过通讯群组限定交流的用户的范围。例如,用户通过腾讯QQ加入相应的好友,该用户与其所有的好友就组成一个通讯群组,该用户能够跟该群组中的用户进行联系。当然用户也可以在该群组下建立子通讯群组,例如QQ群,用户在QQ群中发出的消息,该QQ群中的其他用户也同样可以收到。目前,通常需要对通讯群组中通讯的文本信息进行数据处理,在数据处理时要对文本信息按照一定条件进行提取,其中最常见的就是将出现频率较高的文本信息提取出来。在提取通讯群组中出现频率较高的文本信息时,目前采用的是人工筛查的方式,但是这种人工筛查的方式,不仅工作量很大,而且人工筛查时,筛查人员会看到通讯的所有内容,降低了用户之间通讯的隐私性。
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术的目的就是提供一种基于通讯软件的信息处理方法,能够提取出通讯群组中出现的频率大于一定值的文本信息,并且相比人工筛查减 ...
【技术保护点】
一种基于通讯软件的信息处理方法,其特征在于,所述方法包括:S1:获取在预设时间内,通讯群组中的用户之间通讯的文本信息;S2:将获取到的文本信息进行分段处理;S3:将分段后的文本信息与语料库进行匹配,根据匹配结果生成特征向量;S4:对生成的特征向量进行聚合,得到聚合度大于预设值的文本信息。
【技术特征摘要】
1.一种基于通讯软件的信息处理方法,其特征在于,所述方法包括:S1:获取在预设时间内,通讯群组中的用户之间通讯的文本信息;S2:将获取到的文本信息进行分段处理;S3:将分段后的文本信息与语料库进行匹配,根据匹配结果生成特征向量;S4:对生成的特征向量进行聚合,得到聚合度大于预设值的文本信息。2.如权利要求1所述的基于通讯软件的信息处理方法,其特征在于,所述步骤S1中的通讯群组中设置有第一用户组和第二用户组;所述第一用户组中的用户具有第一权限,所述第二用户组中的用户具有第二权限;所述第一权限使得第一用户组中的用户能查找到第一用户组和第二用户组中的用户,所述第二权限使得第二用户组中的用户仅能查找到与该用户建立了联系的第一用户组中的用户;则所述通讯群组中的用户之间通讯的文本信息具体为:第一用户组的用户之间通讯的文本信息、或者第一用户组的用户与第二用户组的用户之间通讯的文本信息。3.如权利要求2所述的基于通讯软件的信息处理方法,其特征在于,所述步骤S1中获取通讯群组中的用户之间通讯的文本信息包括有:获取与用户A建立联系的第二用户组中的至少一个用户B;其中用户A为第一用户组中的用户;分别统计用户A与所述至少一个用户B...
【专利技术属性】
技术研发人员:彭海军,
申请(专利权)人:重庆首亨软件有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。