一种确定业务参数的方法及装置制造方法及图纸

技术编号:15690888 阅读:77 留言:0更新日期:2017-06-24 03:38
本发明专利技术公开了一种确定业务参数的方法,包括:获取用户应用群组中的公开文本信息;采用预先建立的各类别词语集合对所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签;确定所述类别标签对应的数值,得到所述公开文本信息的评分数值,所述评分数值用于参与确定所述用户的信用评分。本发明专利技术实施例提供的确定业务参数的方法,可以根据用户应用群组的公开文本信息进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。

Method and device for determining service parameter

The invention discloses a method for determining the parameters of the business, including obtaining the open text information user application in the group; the category of words of the pre established public information classify the text set, get the open text information label; numerical determines the category labels corresponding to the numerical score get the public text information, the score values for participation determines the user's credit score. Method for determining service parameters provided by the embodiment of the invention can determine the business parameters according to the open text information user application group, so as to improve business parameters to determine the breadth and wide range of business promotion.

【技术实现步骤摘要】
一种确定业务参数的方法及装置
本专利技术涉及互联网
,具体涉及一种确定业务参数的方法、建立词语分类集合的方法及装置。
技术介绍
当前很多业务与业务参数都是直接相关的,业务参数直接影响到业务申请是否能够成功。业务提供方在为用户分配业务时会根据已有的业务参数来评估是否为该用户分配业务。但目前,在业务提供方有业务参数记录的人只占总人口的一小部分,绝大多数人没有业务参数记录,业务提供方无法对无业务参数记录的用户做出判断,导致业务提供方所提供的业务很难被广泛推广。
技术实现思路
为了解决现有技术中无法得到绝大多数人的业务参数的问题,本专利技术实施例提供一种确定业务参数的方法,可以根据用户应用群组的公开文本信息进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。本专利技术实施例还提供的建立词语分类集合的方法以及相关装置。本专利技术第一方面提供一种确定业务参数的方法,包括:获取待确定业务参数的用户应用群组中的公开文本信息;采用预先建立的各类别词语集合对所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签;确定所述类别标签对应的数值,得到所述公开文本信息的文本数值,所述文本数值用于参与确定所述业务参数。本专利技术第二方面提供一种建立词语分类集合的方法,包括:获取词语库,所述词语库中包括已上线的应用群组中每个应用群组的公开文本信息;通过词向量转换器word2vec从所述词语库中为每个预先确定的类别标签确定相似词语,所述相似词语为相似度满足预设条件的词语;用为每个类别标签确定的所有相似词语组成所述每个类别标签对应的类别词语集合,所述类别词语集合用于确定业务参数。本专利技术第三方面提供一种确定业务参数的装置,包括:获取单元,用于获取待确定业务参数的用户应用群组中的公开文本信息;归类单元,用于采用预先建立的各类别词语集合对所述获取单元获取的所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签;确定单元,用于确定所述归类单元归类得到的所述类别标签对应的数值,得到所述公开文本信息的文本数值,所述文本数值用于参与确定所述业务参数。本专利技术第四方面提供一种建立词语分类集合的装置,包括:获取单元,用于获取词语库,所述词语库中包括已上线的应用群组中每个应用群组的公开文本信息;确定单元,用于通过词向量转换器word2vec从所述获取单元获取的所述词语库中为每个预先确定的类别标签确定相似词语,所述相似词语为相似度满足预设条件的词语;集合建立单元,用于用所述确定单元为每个类别标签确定的所有相似词语组成所述每个类别标签对应的类别词语集合,所述类别词语集合用于确定业务参数。本专利技术实施例采用获取待确定业务参数的用户应用群组中的公开文本信息;采用预先建立的各类别词语集合对所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签;确定所述类别标签对应的数值,得到所述公开文本信息的文本数值,所述文本数值用于参与确定所述业务参数。与现有技术中无法得到绝大多数人的业务参数的问题相比,本专利技术实施例提供一种确定业务参数的方法,可以根据用户应用群组的公开文本信息进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。例如:现有技术中无法评估绝大多数人的可信度,而本申请所提供的方案可以根据用户应用群组的公开文本信息进行信用评分,从而提高了信用评分的广泛度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中建立词语分类集合的方法的一实施例示意图;图2是本专利技术实施例中确定业务参数的方法的一实施例示意图;图3是本专利技术实施例中从建立词语分类集合到确定业务参数的过程示意图;图4是本专利技术实施例中从建立词语分类集合到确定业务参数的实例示意图;图5是本专利技术实施例中确定业务参数的装置的一实施例示意图;图6是本专利技术实施例中确定业务参数的装置的另一实施例示意图;图7是本专利技术实施例中建立词语分类集合的装置的一实施例示意图;图8是本专利技术实施例中确定业务参数的装置的另一实施例示意图;图9是本专利技术实施例中建立词语分类集合的装置的另一实施例示意图。具体实施方式本专利技术实施例提供一种确定业务参数的方法可以根据用户应用群组的公开文本信息进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。本专利技术实施例还提供的建立词语分类集合的方法以及相关装置。以下分别进行详细说明。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。随着各种社交应用的广泛普及,在避免涉及用户隐私的情况下,可以选择用户的应用群组中的公开文本信息来分析用户的信用情况,例如:QQ群和微信群中的公开文本信息,公开文本信息是指所有加入该群组的用户都可见的信息,例如:群名称、群公告和群简介等。这些公开的文本信息是大家都可见的,不涉及到用户隐私,而且,这些应用群是用户根据自己的兴趣爱好和主观意愿主动加入的,这是一种主动的行为,一定程度上反映了用户的心理。需要说明的是,本专利技术实施例的方案不限于社交应用,所有可以公开的用户应用头像都可以用作本专利技术实施例。本专利技术实施例中,通过挖掘用户的所加入的应用群组的公开文本信息来确定业务参数,实际上该业务参数是能反应用户可信度的参数,例如用户的信用评分。当然,确定用户信用评分的因素可以很多,不限于只有应用群组的公开文本信息,应用群组的公开文本信息可以只是用户信用评分中的一项,将诸多因素的信用评分做综合处理,就可以得到一个可靠的用户信用评分。本专利技术实施例中,基于应用群组的公开文本信息来确定与应用群组的公开文本信息相关的业务参数,例如:用户信用评分。传统的给文本信息标上类别的方法主要有两种,一是基于无监督学习的文本聚类,一是基于有监督学习的文本分类。基于无监督学习的文本聚类,此技术主要计算所有样本的聚类中心,并通过计算样本到各个聚类中心的距离,与最小距离相关联的聚类中心为其样本所在的类。这种方法所产生出来的类,用在信用评分模型上不具有可解释性,并且本质上属于同一个类别的不同文本,比如:财付通和支付宝都属于在线支付类可能会聚到不同的类。基于有监督学习的文本分类,此技术主要设计一个分类器,把样本和样本标签作为分类器的输入进行训练,使分类器的目标函数最优,训练好的分类器,可以用来预测文本的类别,达到文本分类的目的。这种方法需要标注大量的文本标签,工作繁琐,且容易出错。针对以上传统方法及其缺点,本专利技术实施例提供了一种建立词语分类集合的方法,以及基于建立的词语分类集合确定业务参数的方法。参阅图1,本专利技术实施例提供的建立词语分类集合的方法的一实施例包括:101、获取词语库,所述词语库中包括已上线的应用群组中每个应用群组的公开文本信息。以QQ中的群组为例,例如:应用群组可以包括投资群组、公益群组、运动群组,以及游戏群组等等,每个群组中的公开文本信息都会添加到本文档来自技高网...
一种确定业务参数的方法及装置

【技术保护点】
一种确定业务参数的方法,其特征在于,包括:获取待确定业务参数的用户应用群组中的公开文本信息;采用预先建立的各类别词语集合对所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签;确定所述类别标签对应的数值,得到所述公开文本信息的文本数值,所述文本数值用于参与确定所述业务参数。

【技术特征摘要】
1.一种确定业务参数的方法,其特征在于,包括:获取待确定业务参数的用户应用群组中的公开文本信息;采用预先建立的各类别词语集合对所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签;确定所述类别标签对应的数值,得到所述公开文本信息的文本数值,所述文本数值用于参与确定所述业务参数。2.根据权利要求1所述的方法,其特征在于,所述采用预先建立的各类别词语集合对所述公开文本信息进行归类处理,得到所述公开文本信息的类别标签,包括:将所述公开文本信息与预先建立的各类别词语集合中的词语进行比对;当比对的结果满足预设条件时,将所述各类别词语集合所关联的类别标签确定为所述公开文本信息的类别标签。3.根据权利要求2所述的方法,其特征在于,所述当比对的结果满足预设条件时,将所述各类别词语集合所关联的类别标签确定为所述公开文本信息的类别标签,包括:当所述公开文本信息中所包含的词语与所述各类别词语集合中相似词语相似的数目和相似系数都分别大于各自的预设门限时,将所述各类别词语集合所关联的类别标签确定为所述公开文本信息的类别标签。4.一种建立词语分类集合的方法,其特征在于,包括:获取词语库,所述词语库中包括已上线的应用群组中每个应用群组的公开文本信息;通过词向量转换器word2vec从所述词语库中为每个预先确定的类别标签确定相似词语,所述相似词语为相似度满足预设条件的词语;用为每个类别标签确定的所有相似词语组成所述每个类别标签对应的类别词语集合,所述类别词语集合用于确定业务参数。5.根据权利要求4所述的方法,其特征在于,所述通过词向量转换器word2vec从所述词语库中为每个预先确定的类别标签确定相似词语,包括:通过词向量转换器word2vec计算所述词语库中每个词语的向量值;根据所述每个词语的向量值与类别标签向量值之间的相似度,为每个预先确定的类...

【专利技术属性】
技术研发人员:吴振国
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1