一种通信过程的评论信息处理方法及系统技术方案

技术编号:13193322 阅读:32 留言:0更新日期:2016-05-11 20:03
本发明专利技术涉及通信技术领域,公开了一种通信过程的评论信息处理方法及系统,以解决现有技术中获取的通信标识的相关信息不够精确的技术问题。该方法包括:收集针对第一通信标识产生的评论信息,评论信息由第一通信标识向其他通信标识发起通信之后由其他通信标识的用户针对第一通信标识进行评论产生;从评论信息中提取出至少一个关键词;基于预先获得的主题与关键词的对应关系信息库,获取至少一个关键词所对应的主题作为第一通信标识所属的主题。达到了能够精确确定出第一通信标识所属的主题的技术效果。

【技术实现步骤摘要】

本专利技术涉及通信
,尤其涉及一种通信过程的评论信息处理方法及系统
技术介绍
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越 来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的移动终 端,享受随着科技发展带来的舒适生活。例如,智能手机、平板电脑等移动终端已经成为人 们生活中一个重要的组成部分,用户可以使用智能手机、平板电脑等移动终端来听音乐、玩 游戏等等,以减轻现代快节奏生活所带来的压力。 通常情况下,移动终端都具备通信功能,移动终端之间可以通过通信标识进行通 信,很多通信标识的用户都为骚扰用户,在这种情况下,其他用户在接收到对应通信标识的 通信内容之后,可以对对应通信标识进行标记,例如:骚扰电话、广告电话等等,进而在服务 器可以对通信标识进行分类,然后这些标记信息往往为一个粗略的标记,故而存在着获取 的通信标识的相关信息不够精确的技术问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上 述问题的通信过程的评论信息处理方法及系统。 第一方面,本专利技术实施例提供一种通信过程的评论信息处理方法,包括: 收集针对第一通信标识产生的评论信息,所述评论信息由所述第一通信标识向其 他通信标识发起通信之后由其他通信标识的用户针对所述第一通信标识进行评论产生; 从所述评论信息中提取出至少一个关键词; 基于预先获得的主题与关键词的对应关系信息库,获取所述至少一个关键词所对 应的主题作为所述第一通信标识所属的主题。 可选的,所述主题与关键词的对应关系信息库通过以下方式获得: 获取用户所产生的多条评论信息作为采样样本; 提取出所述采样样本所包含的所有关键词; 将预先设定的多个主题、所述采样样本和所述关键词输入文档主题生成模型,进 而训练获得所述主题与关键词的对应关系信息库。 可选的,所述基于预先获得的主题与关键词的对应关系信息库,获取所述至少一 个关键词所对应的主题作为所述第一通信标识所属的主题,包括: 针对所述至少一个关键词中的每个关键词,在所述主题与关键词的对应关系中查 找获得对应关键词所属的主题; 将所述至少一个关键词中的每个关键词所属的主题皆作为所述第一通信标识所 属的主题。 可选的,所述从所述评论信息中提取至少一个关键词,包括: 对所述评论信息进行分词处理,获得所述评论信息的关键词; 从所述评论信息的关键词中确定出排序位于前Μ位的关键词作为所述至少一个关 键词,Μ为正整数。 可选的,所述从所述评论信息中提取至少一个关键词,包括: 对所述评论信息进行分词处理,确定分词处理后的所述评论信息中各中文词/字 的词性、确定相邻中文词/字的组合性; 根据所述分词处理后的中文词/字的词性、所述相邻中文词/字的组合性,获得所 述评论信息的关键词。 可选的,所述基于预先获得的主题与关键词的对应关系信息库,获取所述至少一 个关键词所对应的主题作为所述第一通信标识所属的主题,包括: 针对所述主题与关键词的对应关系信息库中的每个主题,确定对应主题的关键词 在所述至少一个关键词中的出现次数; 判断所述出现次数是否大于预设次数; 在所述出现次数大于所述预设次数时,确定对应主题为所述第一通信标识所属的 主题。 可选的,在所述从所述评论信息中提取出至少一个关键词之前,所述方法还包括: 从所述评论信息中去除满足预设条件的评论信息; 其中,所述满足预设条件的评论信息包括:产生评论信息的数量大于预设数量的 用户所对应的评论信息;和/或包含预定词汇的评论信息;和/或预定用户所产生的评论信 息。 可选的,在所述获取所述第一关键词所对应的第一主题作为所述第一通信标识所 属的主题之后,所述方法还包括: 在所述第一通信标识向第二通信标识发起通信之后,向所述第二通信标识提供所 述第一通信标识所属的主题。可选的,在所述获取所述至少一个关键词所对应的主题作为所述第一通信标识所 属的主题之后,所述方法还包括: 在所述第一通信标识向第二通信标识产生通信内容时,判断所述第一通信标识所 属的主题中的任一主题是否属于预设主题列表; 在所述第一通信标识所属的主题中的第一主题属于所述预设主题列表时,向所述 第二通信标识发送风险提示信息。 可选的,所述向所述第二通信标识发送风险提示信息,包括: 向所述第二通信标识发送控制指令,以供所述第二通信标识所对应的电子设备接 收所述控制指令后控制所述第一主题突出显示;和/或, 向所述第二通信标识发送防骚扰指令,以供所述第二通信标识所对应的电子设备 接收所述防骚扰指令后对所述通信内容进行防骚扰处理。第二方面,本专利技术实施例提供一种通信过程的评论信息处理系统,包括:接收模块,用于收集针对第一通信标识产生的评论信息,所述评论信息由所述第 一通信标识向其他通信标识发起通信之后由其他通信标识的用户针对所述第一通信标识 进行评论产生; 第一提取模块,用于从所述评论信息中提取出至少一个关键词; 第一获取模块,用于基于预先获得的主题与关键词的对应关系信息库,获取所述 至少一个关键词所对应的主题作为所述第一通信标识所属的主题。可选的,所述系统还包括: 第二获取模块,用于获取用户所产生的多条评论信息作为采样样本; 第二提取模块,用于提取出所述采样样本所包含的所有关键词;训练模块,用于将预先设定的多个主题、所述采样样本和所述关键词输入文档主 题生成模型,进而训练获得所述主题与关键词的对应关系信息库。 可选的,所述第一获取模块,包括: 查找单元,用于针对所述至少一个关键词中的每个关键词,在所述主题与关键词 的对应关系中查找获得对应关键词所属的主题; 第一确定单元,用于将所述至少一个关键词中的每个关键词所属的主题皆作为所 述第一通信标识所属的主题。可选的,所述第一提取模块,包括: 第一分词单元,用于对所述评论信息进行分词处理,获得所述评论信息的关键词; 第二确定单元,用于从所述评论信息的关键词中确定出排序位于前Μ位的关键词 作为所述至少一个关键词,Μ为正整数。可选的,所述第一提取模块,包括: 第二分词单元,用于对所述评论信息进行分词处理,确定分词处理后的所述评论 信息中各中文词/字的词性、确定相邻中文词/字的组合性;获得单元,用于根据所述分词处理后的中文词/字的词性、所述相邻中文词/字的 组合性,获得所述评论信息的关键词。可选的,所述第一获取模块,包括:第三确定单元,用于针对所述主题与关键词的对应关系信息库中的每个主题,确 定对应主题的关键词在所述至少一个关键词中的出现次数; 判断单元,用于判断所述出现次数是否大于预设次数; 第四确定单元,用于在所述出现次数大于所述预设次数时,确定对应主题为所述 第一通信标识所属的主题。 可选的,所述系统还包括: 去除模块,用于在从所述评论信息中提取出至少一个关键词之前,从所述评论信 息中去除满足预设条件的评论信息; 其中,所述满足预设条件的评论信息包括:产生评论信息的数量大于预设数量的 用户所对应的评论信息;和/或包含预定词汇的评论信息;和/或预定用户所产生的评论信 息。 可选的,所述系统还包括:提供模块,用于在所述第一通信标识向第二通信标识发起通信之后,向所述第二 通信标识提供所述第一通信标识所属的主题。 可选的,所本文档来自技高网...

【技术保护点】
一种通信过程的评论信息处理方法,其特征在于,包括:收集针对第一通信标识产生的评论信息,所述评论信息由所述第一通信标识向其他通信标识发起通信之后由其他通信标识的用户针对所述第一通信标识进行评论产生;从所述评论信息中提取出至少一个关键词;基于预先获得的主题与关键词的对应关系信息库,获取所述至少一个关键词所对应的主题作为所述第一通信标识所属的主题。

【技术特征摘要】

【专利技术属性】
技术研发人员:马璇常富洋
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1