信息校准方法和装置制造方法及图纸

技术编号:19101655 阅读:36 留言:0更新日期:2018-10-03 03:50
本申请公开了信息校准方法和装置。上述方法的一具体实施方式包括:接收客户端发送的信息校准请求,其中,信息校准请求包括待解析字段;对待解析字段执行第一解析操作,确定是否解析成功;响应于确定解析失败,从待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量匹配的类型,其中,分类模型用于表征特征向量与类型的对应关系;基于各个特征向量的类型对待解析字段执行第二解析操作,生成第二校准信息;将第二校准信息发送至客户端,以使客户端根据第二校准信息进行信息校准。该实施方式减少了人力成本,提高了信息校准的准确性。

【技术实现步骤摘要】
信息校准方法和装置
本申请涉及计算机
,具体涉及互联网
,尤其涉及信息校准方法和装置。
技术介绍
随着高速网络的出现,流量、话费监控类应用越来越普及。为了使用户可以准确而直观的得知流量、话费等使用情况,需要对上述监控类应用中所呈现的信息进行校准。现有的信息校准方法通常是基于开发人员编写的正则表达式对运营商短信中的关键词进行匹配,来确定剩余的流量、话费情况。这种方法需要较大的人力成本进行编辑和维护,准确率较低且难以提升。
技术实现思路
本申请的目的在于提出一种改进的信息校准方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种信息校准方法,上述方法包括:接收客户端发送的信息校准请求,其中,上述信息校准请求包括待解析字段;对上述待解析字段执行第一解析操作,确定是否解析成功;响应于确定解析失败,从上述待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量匹配的类型,其中,上述分类模型用于表征特征向量与类型的对应关系;基于各个特征向量的类型对上述待解析字段执行第二解析操作,生成第二校准信息;将上述第二校准信息发送至上述客户端,以使上述客户端根据上述第二校准信息进行信息校准。在一些实施例中,上述信息校准请求还包括归属地标识和运营商标识;以及对上述待解析字段执行第一解析操作,确定是否解析成功,包括:加载与上述归属地标识匹配的目标配置文件,其中,上述目标配置文件用于存储位于上述归属地的多个运营商的配置信息,配置信息用于指示对字段的解析操作;确定上述目标配置文件中的与上述运营商标识匹配的目标配置信息;基于上述目标配置信息对上述待解析字段执行第一解析操作,确定是否解析成功。在一些实施例中,在接收客户端发送的信息校准请求之前,上述方法还包括:获取位于多个归属地的多个运营商的短信模板;对所获取的短信模板进行相似度计算;基于相似度计算结果和所获取的短信模板,生成多个配置信息;将位于同一归属地的各个运营商的配置信息存储至同一配置文件。在一些实施例中,上述基于上述目标配置信息对上述待解析字段执行第一解析操作,确定是否解析成功,包括:响应于各个目标字段均解析成功,则确定上述待解析字段解析成功。在一些实施例中,上述基于上述目标配置信息对上述待解析字段执行第一解析操作,确定是否解析成功,包括:响应于存在解析失败的目标字段,则确定上述待解析字段解析失败。在一些实施例中,上述待解析字段包括业务类型字段;以及上述对上述待解析字段执行第一解析操作,包括:识别上述待解析字段中的业务类型字段,确定业务类型;提取预置的与上述业务类型匹配的待替换字段集合,其中,上述待替换字段集合中的每一个待替换字段与一个预设字段相对应;对于上述待替换字段集合中的每一个待替换字段,从上述待解析字段中检索与该待替换字段匹配的字段,将检索出的字段替换为与该待替换字段对应的预设字段;逐句切分上述待解析字段,生成多个待解析子字段;将包含业务信息的待解析子字段确定为目标字段,对上述目标字段进行解析,生成第一校准信息。在一些实施例中,上述方法还包括:响应于解析成功,将上述第一校准信息发送至上述客户端,以使上述客户端根据上述第一校准信息进行信息校准。在一些实施例中,上述响应于解析失败,从上述待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量相匹配的类型,包括:响应于解析失败,加载预先训练的分类模型;对上述待解析字段进行切分,生成多个切分字段;对上述多个切分字段中的每一个切分字段进行特征提取,生成与上述分类模型的输入相匹配的特征向量;输入特征向量至上述分类模型,得到与各个切分字段相匹配的类型。在一些实施例中,上述基于各个特征向量的类型对上述待解析字段执行第二解析操作,生成第二校准信息,包括:对于每一个切分字段,基于该切分字段的类型,获取预置的与该类型匹配的字段模板;基于字段模板对各个切分字段进行处理,生成第二校准信息。在一些实施例中,上述分类模型通过以下步骤预先生成:将训练样本进行切分,生成多个切分样本,其中,上述多个切分样本中的每一个切分样本带有类型标识;提取每一个切分样本中的特征信息,生成特征向量;利用朴素贝叶斯算法和支持向量机,基于特征向量和类型标识,训练得到分类模型。第二方面,本申请提供了信息校准装置,上述装置包括:接收单元,配置用于接收客户端发送的信息校准请求,其中,上述信息校准请求包括待解析字段;第一解析单元,配置用于对上述待解析字段执行第一解析操作,确定是否解析成功;确定单元,配置用于响应于确定解析失败,从上述待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量匹配的类型,其中,上述分类模型用于表征特征向量与类型的对应关系;第二解析单元,配置用于基于各个特征向量的类型对上述待解析字段执行第二解析操作,生成第二校准信息;第一发送单元,配置用于将上述第二校准信息发送至上述客户端,以使上述客户端根据上述第二校准信息进行信息校准。在一些实施例中,上述信息校准请求还包括归属地标识和运营商标识;以及上述第一解析单元包括:第一加载模块,配置用于加载与上述归属地标识匹配的目标配置文件,其中,上述目标配置文件用于存储位于上述归属地的多个运营商的配置信息,配置信息用于指示对字段的解析操作;确定模块,配置用于确定上述目标配置文件中的与上述运营商标识匹配的目标配置信息;解析模块,配置用于基于上述目标配置信息对上述待解析字段执行第一解析操作,确定是否解析成功。在一些实施例中,上述装置还包括:获取单元,配置用于获取位于多个归属地的多个运营商的短信模板;计算单元,配置用于对所获取的短信模板进行相似度计算;生成单元,配置用于基于相似度计算结果和所获取的短信模板,生成多个配置信息;存储单元,配置用于将位于同一归属地的各个运营商的配置信息存储至同一配置文件。在一些实施例中,上述解析模块进一步配置用于:响应于各个目标字段均解析成功,则确定上述待解析字段解析成功。在一些实施例中,上述解析模块进一步配置用于:响应于存在解析失败的目标字段,则确定上述待解析字段解析失败。在一些实施例中,上述待解析字段包括业务类型字段;以及上述第一解析单元包括:识别模块,配置用于识别上述待解析字段中的业务类型字段,确定业务类型;提取模块,配置用于提取预置的与上述业务类型匹配的待替换字段集合,其中,上述待替换字段集合中的每一个待替换字段与一个预设字段相对应;替换模块,配置用于对于上述待替换字段集合中的每一个待替换字段,从上述待解析字段中检索与该待替换字段匹配的字段,将检索出的字段替换为与该待替换字段对应的预设字段;第一切分模块,配置用于逐句切分上述待解析字段,生成多个待解析子字段;第一生成模块,配置用于将包含业务信息的待解析子字段确定为目标字段,对上述目标字段进行解析,生成第一校准信息。在一些实施例中,上述装置还包括:第二发送单元,配置用于响应于解析成功,将上述第一校准信息发送至上述客户端,以使上述客户端根据上述第一校准信息进行信息校准。在一些实施例中,上述确定单元包括:第二加载模块,配置用于响应于解析失败,加载预先训练的分类模型;第二切分模块,配置用于对上述待解析字段进行切分,生成多本文档来自技高网...

【技术保护点】
1.一种信息校准方法,其特征在于,所述方法包括:接收客户端发送的信息校准请求,其中,所述信息校准请求包括待解析字段;对所述待解析字段执行第一解析操作,确定是否解析成功;响应于确定解析失败,从所述待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量匹配的类型,其中,所述分类模型用于表征特征向量与类型的对应关系;基于各个特征向量的类型对所述待解析字段执行第二解析操作,生成第二校准信息;将所述第二校准信息发送至所述客户端,以使所述客户端根据所述第二校准信息进行信息校准。

【技术特征摘要】
1.一种信息校准方法,其特征在于,所述方法包括:接收客户端发送的信息校准请求,其中,所述信息校准请求包括待解析字段;对所述待解析字段执行第一解析操作,确定是否解析成功;响应于确定解析失败,从所述待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量匹配的类型,其中,所述分类模型用于表征特征向量与类型的对应关系;基于各个特征向量的类型对所述待解析字段执行第二解析操作,生成第二校准信息;将所述第二校准信息发送至所述客户端,以使所述客户端根据所述第二校准信息进行信息校准。2.根据权利要求1所述的信息校准方法,其特征在于,所述信息校准请求还包括归属地标识和运营商标识;以及对所述待解析字段执行第一解析操作,确定是否解析成功,包括:加载与所述归属地标识匹配的目标配置文件,其中,所述目标配置文件用于存储位于所述归属地的多个运营商的配置信息,配置信息用于指示对字段的解析操作;确定所述目标配置文件中的与所述运营商标识匹配的目标配置信息;基于所述目标配置信息对所述待解析字段执行第一解析操作,确定是否解析成功。3.根据权利要求2所述的信息校准方法,其特征在于,在接收客户端发送的信息校准请求之前,所述方法还包括:获取位于多个归属地的多个运营商的短信模板;对所获取的短信模板进行相似度计算;基于相似度计算结果和所获取的短信模板,生成多个配置信息;将位于同一归属地的各个运营商的配置信息存储至同一配置文件。4.根据权利要求2所述的信息校准方法,其特征在于,所述基于所述目标配置信息对所述待解析字段执行第一解析操作,确定是否解析成功,包括:响应于各个目标字段均解析成功,则确定所述待解析字段解析成功。5.根据权利要求2所述的信息校准方法,其特征在于,所述基于所述目标配置信息对所述待解析字段执行第一解析操作,确定是否解析成功,包括:响应于存在解析失败的目标字段,则确定所述待解析字段解析失败。6.根据权利要求1-5之一所述的信息校准方法,其特征在于,所述待解析字段包括业务类型字段;以及所述对所述待解析字段执行第一解析操作,包括:识别所述待解析字段中的业务类型字段,确定业务类型;提取预置的与所述业务类型匹配的待替换字段集合,其中,所述待替换字段集合中的每一个待替换字段与一个预设字段相对应;对于所述待替换字段集合中的每一个待替换字段,从所述待解析字段中检索与该待替换字段匹配的字段,将检索出的字段替换为与该待替换字段对应的预设字段;逐句切分所述待解析字段,生成多个待解析子字段;将包含业务信息的待解析子字段确定为目标字段,对所述目标字段进行解析,生成第一校准信息。7.根据权利要求6所述的信息校准方法,其特征在于,所述方法还包括:响应于解析成功,将所述第一校准信息发送至所述客户端,以使所述客户端根据所述第一校准信息进行信息校准。8.根据权利要求1所述的信息校准方法,其特征在于,所述响应于解析失败,从所述待解析字段中提取至少一个特征向量,输入特征向量至预先训练的分类模型,确定出与各个特征向量相匹配的类型,包括:响应于解析失败,加载预先训练的分类模型;对所述待解析字段进行切分,生成多个切分字段;对所述多个切分字段中的每一个切分字段进行特征提取,生成与所述分类模型的输入相匹配的特征向量;输入特征向量至所述分类模型,得到与各个切分字段相匹配的类型。9.根据权利要求8所述的信息校准方法,其特征在于,所述基于各个特征向量的类型对所述待解析字段执行第二解析操作,生成第二校准信息,包括:对于每一个切分字段,基于该切分字段的类型,获取预置的与该类型匹配的字段模板;基于字段模板对各个切分字段进行处理,生成第二校准信息。10.根据权利要求1所述的信息校准方法,其特征在于,所述分类模型通过以下步骤预先生成:将训练样本进行切分,生成多个切分样本,其中,所述多个切分样本中的每一个切分样本带有类型标识;提取每一个切分样本中的特征信息,生成特征向量;利用朴素贝叶斯算法和支持向量机,基于特征向量和类型标识,训练得到分类模型。11.一种信息校准装置,其特征在于,所述装置包括:接收单元,配置用于接收客户端发送的信息校...

【专利技术属性】
技术研发人员:刘旭东温玉东陶孝禹熊可欣
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1