一种分类信息的确定方法以及相关装置制造方法及图纸

技术编号:17561937 阅读:30 留言:0更新日期:2018-03-28 12:24
本发明专利技术实施例公开了一种分类信息的确定方法,包括:获取文本信息集合,文本信息集合中包含至少一个文本信息;通过第一分类模型对至少一个文本信息进行处理,获取至少一个文本信息中各个文本信息所对应的第一分类权重值,其中,第一分类模型为根据预设文本信息以及预设文本信息的出现频次训练得到的;通过第二分类模型对至少一个文本信息进行处理,获取至少一个文本信息中各个文本信息所对应的第二分类权重值,第二分类模型为根据外部文本信息对应的词向量训练得到的;根据第一分类权重值和第二分类权重值确定文本信息集合的分类信息。本发明专利技术还提供一种分类信息确定装置。本发明专利技术能够快捷并客观地对公司名称进行分类,从而提升方案的实用性。

A method for determining the classification information and related devices

The embodiment of the invention includes determining methods, discloses a classification information: acquiring text information collection, text information collection contains at least one text information; according to at least one of the first text information classification model, obtaining the first classification weight of at least one corresponding to the text information of text information in the value. Among them, the first classification model according to the preset text information and text information obtained from the training frequency; based on at least one of the second classification model of text information processing, acquiring at least one corresponding to each text information of text information in second classification weights, second classification model according to the corresponding external text information word the vector obtained from the training; according to the first classification weights and second classification weights of classified information text information collection. The invention also provides a classification information determination device. The invention can quickly and objectively classify the name of the company so as to improve the practicability of the scheme.

【技术实现步骤摘要】
一种分类信息的确定方法以及相关装置
本专利技术涉及互联网
,尤其涉及一种分类信息的确定方法以及相关装置。
技术介绍
公司名称对一个企业的发展而言是至关重要的,因为公司名称它不仅关系到企业在行业内的影响力,还关系到企业所经营的产品投放市场后,消费者对该企业的认可度。公司名称可以在一定程度上反映出这个公司的经验范围以及行业分类,从而可以根据公司名称向该公司推荐与其相关业务。目前,公司运营人员可以借助公司名称信息以及企业相关的外部数据对公司名称进行分类,分类结果能够帮助企业生成客户画像,挖掘潜在客户,有助于企业做出决策。然而,基于人工搜索的方式对公司名称进行分类效率低下,且公司名分类局限于运营人员的主观判断,具有较强的主观性,不利于分类的准确性,从而降低方案的实用性。
技术实现思路
本专利技术实施例提供了一种分类信息的确定方法以及相关装置,能够基于统计学得到第一分类模型,并且基于大数据分析训练得到第二分类模型,利用这两个分类模型可以快捷并客观地对公司名称进行分类,从而提升方案的实用性。有鉴于此,本专利技术第一方面提供了一种分类信息的确定方法,包括:获取文本信息集合,其中,所述文本信息集合本文档来自技高网...
一种分类信息的确定方法以及相关装置

【技术保护点】
一种分类信息的确定方法,其特征在于,包括:获取文本信息集合,其中,所述文本信息集合中包含至少一个文本信息;通过第一分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第一分类权重值,其中,所述第一分类模型为根据预设文本信息以及所述预设文本信息的出现频次训练得到的;通过第二分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第二分类权重值,其中,所述第二分类模型为根据外部文本信息对应的词向量训练得到的;根据所述第一分类权重值和所述第二分类权重值确定所述文本信息集合的分类信息。

【技术特征摘要】
1.一种分类信息的确定方法,其特征在于,包括:获取文本信息集合,其中,所述文本信息集合中包含至少一个文本信息;通过第一分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第一分类权重值,其中,所述第一分类模型为根据预设文本信息以及所述预设文本信息的出现频次训练得到的;通过第二分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第二分类权重值,其中,所述第二分类模型为根据外部文本信息对应的词向量训练得到的;根据所述第一分类权重值和所述第二分类权重值确定所述文本信息集合的分类信息。2.根据权利要求1所述的方法,其特征在于,所述通过第一分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第一分类权重值之前,所述方法还包括:获取预设文本信息集合,其中,所述预设文本信息集合中包含至少一个所述预设文本信息;获取各个所述预设文本信息的出现频次以及至少一个所述预设文本信息的总频次;对各个所述预设文本信息的出现频次以及至少一个所述预设文本信息的总频次进行训练,得到所述第一分类模型。3.根据权利要求2所述的方法,其特征在于,所述通过第一分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第一分类权重值,包括:将所述至少一个文本信息中各个文本信息输入至所述第一分类模型;根据所述第一分类模型、所述各个文本信息所对应的出现频次以及所述总频次计算得到所述第一分类权重值。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述通过第二分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第二分类权重值之前,所述方法还包括:获取外部文本信息集合,其中,所述预设文本信息集合中包含至少一个所述外部文本信息;根据至少一个所述外部文本信息生成各个所述外部文本信息所对应的词向量;对所述各个所述外部文本信息所对应的词向量进行训练,得到所述第二分类模型。5.根据权利要求4所述的方法,其特征在于,所述通过第二分类模型对所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第二分类权重值,包括:将所述至少一个文本信息中各个文本信息输入至所述第二分类模型;通过所述第二分类模型确定所述各个文本信息所对应的相似文本信息;通过所述第二分类模型根据所述相似文本信息的出现频次、总频次以及迭代次数,确定所述第二分类权重值。6.根据权利要求2所述的方法,其特征在于,所述对每个所述预设文本信息的出现频次以及至少一个所述预设文本信息的总频次进行训练,得到所述第一分类模型之后,所述方法还包括:根据N个所述预设文本信息的出现频次获取n个所述预设文本信息,其中,所述N为大于0的正整数,所述n为大于0且小于所述N的正整数;接收n个所述预设文本信息所对应的标注信息,其中,所述标注信息用于表示所述预设文本信息的类型;对n个所述预设文本信息所对应的标注信息以及类型可行度进行训练,得到所述第三分类模型,其中,所述类型可信度用于表示所述标注信息与真实信息的贴合程度。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一分类权重值和所述第二分类权重值确定所述文本信息集合的分类信息,包括:通过所述第三分类模型对所述第一分类权重值进行处理,获取第一子分类权重值以及第二子分类权重值,并通过所述第三分类模型对所述第二分类权重值进行处理,获取第三子分类权重值以及第四子分类权重值,其中,所述第一子分类权重值与所述第三子分类权重值属于同一类别,所述第二子分类权重值与所述第四子分类权重值属于同一类别;根据所述第一子分类权重值与所述第三子分类权重值计算得到第一类别信息的权重值,并根据所述第二子分类权重值与所述第四子分类权重值计算得到第二类别信息的权重值;若所述第一类别信息的权重值大于所述第二类别信息的权重值,则将所述第一类别信息确定为所述分类信息;若所述第二类别信息的权重值大于所述第一类别信息的权重值,则将所述第二类别信息确定为所述分类信息。8.一种分类信息确定装置,其特征在于,包括:第一获取模块,用于获取文本信息集合,其中,所述文本信息集合中包含至少一个文本信息;第一处理模块,用于通过第一分类模型对所述第一获取模块获取的所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第一分类权重值,其中,所述第一分类模型为根据预设文本信息以及所述预设文本信息的出现频次训练得到的;第二处理模块,用于通过第二分类模型对所述第一获取模块获取的所述至少一个文本信息进行处理,获取所述至少一个文本信息中各个文本信息所对应的第二分类权重值,其中,所述第二分类模型为根据外部文本信息对应的词向量训练得到的;确定模块,...

【专利技术属性】
技术研发人员:车进曾晶陈桓张良杰
申请(专利权)人:金蝶软件中国有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1