一种文本信息处理方法及装置制造方法及图纸

技术编号:16346027 阅读:50 留言:0更新日期:2017-10-03 22:22
本发明专利技术实施例提供一种文本信息处理方法和装置,所述方法包括:获取文本信息;对所述文本信息进行规则提取,生成文本信息识别模板;所述文本信息识别模板用于进行文本信息匹配。本发明专利技术实施例可以标识文本信息的可信度,特别可以应用于准确识别垃圾短信、诈骗短信等文本信息,有效拦截此类信息,有效保护用户信息、财产安全。

【技术实现步骤摘要】
一种文本信息处理方法及装置
本专利技术实施例涉及计算机
,具体涉及一种文本信息处理方法及装置。
技术介绍
随着移动通信技术的发展,智能终端得到了广泛的应用。用户使用智能终端进行通信,例如拨打电话、发送短信、使用即时通讯(英文全称为InstantMessaging,英文简称为IM)软件进行文本或者语音通信等。用户在享受移动通信技术带来的方便的同时,也饱受垃圾短信的困扰。因此,如何标识信息的可信性成为一个重要的问题。现有技术中,在标识信息的可信性时,主要是通过检测垃圾信息的方式来标识非法信息。具体的,现有技术主要存在两种非法短信检测方法。一种是通过标识发送非法信息的发送者的号码,过滤来自所述号码的短信的方式实现对非法信息的检测和拦截。一种是通过设置非法信息关键词,通过关键词识别的方式检测非法信息。这两种方式在一定程度上能够检测、拦截部分非法信息。然而,不法分子利用短信进行诈骗的技术越来越高明,传统的非法信息检测技术已经很难准确地检测、拦截非法信息。目前已经出现不法分子通过伪基站仿造号码来发送诈骗信息的事件。不法分子通过伪基站仿造号码,可以使用与银行、运营商、服务商等一致的号码,例如本文档来自技高网...
一种文本信息处理方法及装置

【技术保护点】
一种文本信息处理方法,其特征在于,包括:获取文本信息;对所述文本信息进行规则提取,生成文本信息识别模板;所述文本信息识别模板用于进行文本信息匹配。

【技术特征摘要】
1.一种文本信息处理方法,其特征在于,包括:获取文本信息;对所述文本信息进行规则提取,生成文本信息识别模板;所述文本信息识别模板用于进行文本信息匹配。2.根据权利要求1所述的方法,其特征在于,所述获取文本信息包括:接收包含第一标识的文本信息;所述第一标识用于标识所述文本信息;或者,响应于用户标识文本信息的操作,获取所述文本信息。3.根据权利要求1所述的方法,其特征在于,所述文本信息识别模板包括符合句法规则的字符串。4.根据权利要求1或3所述的方法,其特征在于,所述对所述文本信息进行规则提取,生成文本信息识别模板包括:利用正则表达式对所述文本信息进行规则提取,生成文本信息识别模板。5.根据权利要求1、3或4所述的方法,其特征在于,所述方法还包括:对所述文本信息进行聚类处理,获取所述文本信息所属的文本类别;所述对所述文本信息进行规则提取,生成文本信息识别模板具体为:对符合预设条件的文本类别对应的文本信息进行规则提取,生成文本信息识别模板。6.根据权利要求5所述的方法,其特征在于,所述对所述文本信息进行聚类处理,获取所述文本信息的文本类别包括:获取所述文本信息的核心信息对应的语种,去除所述文本信息中非所述语种的语言表示的字符,获得处理后的文本信息;将所述处理后的文本信息与预先存储的文本类别中的文本信息进行比较,获取所述处理后的文本信息与所述预先存储的文本类别中的文本信息的相似度值;若所述处理后的文本信息与所述预先存储的任意一个文本类别中的文本信息的相似度值大于第一设定阈值,确定所述处理后的文本信息属于所述文本类别;若所述处理后的文本信息与所述预先存储的所有文本类别中的文本信息的相似度值小于第一设定阈值,为所述文本信息创建新的文本类别。7.根据权利要求5所述的方法,其特征在于,所述预设条件包括:所述文本类别的风险阈值大于第二设定阈值;其中,所述文本类别的风险阈值根据所述文本类别的风险特征值得到;所述风险特征值包括所述文本类别的出现时间、出现频率、出现地域中的任意一种或多种。8.一种文本信息处理方法,其特征在于,包括:接收第一文本信息;将所述第一文本信息与预存的文本信息识别模板进行匹配,获得匹配结果;所述文本信息识别模板用于进行文本信息匹配;根据所述匹配结果,标识所述文本信息的可信度。9.根据权利要求8所述的方法,其特征在于,所述根据所述匹配结果,标识所述文本信息的可信度包括:根据获取的所述第一文本信息与预存的文本信息识别模板的匹配值以及预先保存的匹配值与可信度等级的对应关系,标识所述文本信息的可信度等级。10.根据权利要求8所述的方法,其特征在于,所述根据所述匹配结果,标识所述文本信息的可信度包括:当所述匹配结果表明所述第一文本...

【专利技术属性】
技术研发人员:韩秦
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1