一种确定商户经营类别的方法、装置、设备和存储介质制造方法及图纸

技术编号:21687513 阅读:18 留言:0更新日期:2019-07-24 15:02
本发明专利技术实施例涉及网络技术领域,特别涉及一种确定商户经营类别的方法、装置、设备和存储介质。本发明专利技术中,该确定商户经营类别的方法包括:获得待分类的商户的经营数据;处理待分类的商户的经营数据,获得处理后的数据;将处理后的数据输入到多分类模型中进行预测,确定待分类商户的经营类别。服务器通过多分类模型对处理后的待分类的商户的经营数据进行预测,能够快速的获得商户对应的经营类别,相对于采用一对多的支持向量机的方式,降低了处理时间,提高用户体验度,并且,相对于使用人工标注的方式,提高了商户的经营类别的准确性,避免了由于线上人工标注的商户的经营类别不准确,而导致用户体验差的问题。

A Method, Device, Equipment and Storage Medium for Determining Business Category

【技术实现步骤摘要】
一种确定商户经营类别的方法、装置、设备和存储介质
本专利技术实施例涉及网络
,特别涉及一种确定商户经营类别的方法、装置、设备和存储介质。
技术介绍
目前,在外卖平台中,是根据商户提供的商品和服务来确定该商户的经营范围的,例如:家常小炒、盖饭、盒饭便当、火锅等,这些经营范围都是人工标注的,并且每个商户都对应不同种类的经营范围,因此在多个类别的经营范围中,选取其中一个作为该商户最主要的经营范围,能够帮助用户更明确地知道该商户具体的经营范围,进而帮助用户准确选择所需要的外卖菜品。专利技术人发现现有技术中至少存在如下问题:使用一对多的支持向量机的分类方法(OneVersusRestSupportVectorMachine,OVRSVM)来对线上人工标注的商户的主要经营范围进行分类,会导致分类不准确,并且使外卖平台的处理时间相对较长,进而使得外卖平台的时延较大,导致用户在使用时无法及时的找到自己想要的分类商户,造成用户体验度差的问题。
技术实现思路
本专利技术实施方式的目的在于提供一种确定商户经营类别的方法、装置、设备和存储介质,用以解决上述对商户的主要经营范围分类不准确,并使得外卖平台的处理时延较大的问题。为解决上述技术问题,本专利技术的实施方式提供了一种确定商户经营类别的方法,包括以下步骤:获得待分类的商户的经营数据;处理待分类的商户的经营数据,获得处理后的数据;将处理后的数据输入到多分类模型中进行预测,确定待分类商户的经营类别。本专利技术的实施方式还提供了一种确定商户经营类别的装置,包括:获取模块,用于获得待分类的商户的经营数据;处理模块,用于处理待分类的商户的经营数据,获得处理后的数据;确定模块,用于将处理后的数据输入到多分类模型中进行预测,确定待分类商户的经营类别。本专利技术的实施方式还提供了一种电子设备,包括存储器和处理器,存储器存储计算机程序,处理器运行程序时执行:获得待分类的商户的经营数据;处理待分类的商户的经营数据,获得处理后的数据;将处理后的数据输入到多分类模型中进行预测,确定待分类商户的经营类别。本专利技术的实施方式还提供了一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行如上所述的确定商户经营类别的方法。本专利技术实施方式相对于现有技术而言,主要区别及其效果在于:服务器通过多分类模型对处理后的待分类的商户的经营数据进行预测,能够快速的获得商户对应的经营类别,相对于采用一对多的支持向量机的方式,降低了处理时间,提高用户体验度,并且,相对于使用人工标注的方式,提高了商户的经营类别的准确性,避免了由于线上人工标注的商户的经营类别不准确,而导致用户体验差的问题。另外,将处理后的数据输入到多分类模型中进行预测,确定待分类商户的经营类别,包括:根据处理后的数据和多分类模型,确定m(m-1)/2个分类预测结果;根据m(m-1)/2个分类预测结果,确定待分类商户的经营类别;其中,多分类模型包括m(m-1)/2个二元分类器模型,二元分类器模型用于对m个经营类别中的任意两个经营类别进行分类,m为不小于2的整数。该方式中,服务器通过m(m-1)/2个二元分类器模型,能够快速的获得商户对应的经营类别,相对于采用一对多的支持向量机的方式,降低了处理时间,提高用户体验度,并且,相对于使用人工标注的方式,提高了商户的经营类别的准确性,避免了由于线上人工标注的商户的经营类别不准确,而导致用户体验差的问题。另外,在获得待分类的商户的经营数据之前,还包括:确定m个经营类别各自对应的样本经营数据;采用m个经营类别各自对应的样本经营数据,训练得到m(m-1)/2个二元分类器模型;根据训练得到的m(m-1)/2个二元分类器模型,确定多分类模型。另外,采用m个经营类别各自对应的样本经营数据,训练得到m(m-1)/2个二元分类器模型,包括:根据m个经营类别各自对应的样本经营数据,确定m个经营类别各自对应的特征向量;将m个经营类别各自对应的特征向量进行两两组合后,分别采用每一种组合训练二元分类器模型,得到m(m-1)/2个二元分类器模型。该方式中,通过将m个经营类别各自对应的特征向量,进行两两组合的方式进行训练,获得包括m(m-1)/2个二元分类器模型的多分类模型,相对于采用一对多的支持向量机的方式,减少了训练的时间开销,降低了处理时间。另外,确定m个经营类别各自对应的样本经营数据,包括:分别获取m个经营类别各自对应的初始样本经营数据;对m个经营类别各自对应的初始样本经营数据进行均衡处理,得到m个经营类别各自对应的样本经营数据,其中,对于m个经营类别中的任意两个类别的样本经营数据的数量的差值不超过预设值。另外,对m个经营类别各自对应的初始样本经营数据进行均衡处理,得到m个经营类别各自对应的样本经营数据,包括:对m个经营类别中的每个经营类别进行以下处理:若确定经营类别对应的初始样本经营数据的数量小于预设阈值,则对经营类别对应的初始样本经营数据进行SMOTE过采样,获得经营类别对应的样本经营数据;若确定经营类别对应的初始样本经营数据的数量大于预设阈值,则对经营类别对应的初始样本经营数据进行随机欠采样,获得经营类别对应的样本经营数据。该方式中,通过对初始样本经营数据进行SMOTE过采样或随机欠采样处理,使得样本经营数据的分布更加均衡,对该样本经营数据进行训练,能够获得准确性更高的多分类模型,提高了确定待分类商户的经营类别的准确性。另外,样本经营数据包括:菜品名的数量、菜品名和每个菜品名对应的出单量;待分类的商户的经营数据包括:待分类的商户包括的菜品名的数量、菜品名和每个菜品名对应的出单量。另外,获得待分类的商户的经营数据,包括:根据m个经营类别中的每一个经营类别对应的菜品名的数量、菜品名和每个菜品名对应的出单量,确定每一个经营类别对应的样本经营数据;根据m个经营类别中的每一个经营类别对应的样本经营数据,确定每一个经营类别对应的特征向量,其中,特征向量中包括n个元素,第i个元素表示为ai,i表示菜品名,ai表示菜品名对应的出单量,n为菜品名的数量;从m个经营类别各自对应的样本经营数据中,选择任一个作为待分类的商户的经营数据。另外,处理待分类的商户的经营数据,获得处理后的数据,包括:根据待分类的商户的经营数据,确定待分类的商户对应的特征向量;将待分类的商户对应的特征向量,作为处理后的数据。另外,根据处理后的数据和多分类模型,确定m(m-1)/2个分类预测结果,包括:根据处理后的数据,确定待分类的商户对应的特征向量;将待分类的商户对应的特征向量输入到多分类模型中,确定m(m-1)/2个分类预测结果。另外,根据m(m-1)/2个分类预测结果,确定待分类商户的经营类别,包括:确定m(m-1)/2个分类预测结果中的各个分类预测结果对应的重复次数;将重复次数最多的分类预测结果,作为待分类商户的经营类别。该方式中,通过使用m(m-1)/2个分类预测结果中重复次数最多的分类预测结果,作为待分类商户的经营类别,提高了确定待分类商户的经营类别的准确性,使用户在外卖平台上查找自己想要的分类商户时,能够更加准确的找到自己想要的分类商户,提高用户体验度。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定本文档来自技高网...

【技术保护点】
1.一种确定商户经营类别的方法,其特征在于,所述方法包括:获得待分类的商户的经营数据;处理所述待分类的商户的经营数据,获得处理后的数据;将所述处理后的数据输入到多分类模型中进行预测,确定所述待分类商户的经营类别。

【技术特征摘要】
1.一种确定商户经营类别的方法,其特征在于,所述方法包括:获得待分类的商户的经营数据;处理所述待分类的商户的经营数据,获得处理后的数据;将所述处理后的数据输入到多分类模型中进行预测,确定所述待分类商户的经营类别。2.根据权利要求1所述的确定商户经营类别的方法,其特征在于,将所述处理后的数据输入到多分类模型中进行预测,确定所述待分类商户的经营类别,包括:根据所述处理后的数据和所述多分类模型,确定m(m-1)/2个分类预测结果;根据所述m(m-1)/2个分类预测结果,确定所述待分类商户的经营类别;其中,所述多分类模型包括m(m-1)/2个二元分类器模型,所述二元分类器模型用于对m个经营类别中的任意两个经营类别进行分类,所述m为不小于2的整数。3.根据权利要求2所述的确定商户经营类别的方法,其特征在于,在获得待分类的商户的经营数据之前,还包括:确定所述m个经营类别各自对应的样本经营数据;采用所述m个经营类别各自对应的样本经营数据,训练得到m(m-1)/2个二元分类器模型;根据训练得到的m(m-1)/2个二元分类器模型,确定所述多分类模型。4.根据权利要求3所述的确定商户经营类别的方法,其特征在于,采用所述m个经营类别各自对应的样本经营数据,训练得到m(m-1)/2个二元分类器模型,包括:根据所述m个经营类别各自对应的样本经营数据,确定所述m个经营类别各自对应的特征向量;将所述m个经营类别各自对应的特征向量进行两两组合后,分别采用每一种组合训练二元分类器模型,得到m(m-1)/2个二元分类器模型。5.根据权利要求3所述的确定商户经营类别的方法,其特征在于,确定所述m个经营类别各自对应的样本经营数据,包括:分别获取所述m个经营类别各自对应的初始样本经营数据;对所述m个经营类别各自对应的初始样本经营数据进行均衡处理,得到所...

【专利技术属性】
技术研发人员:郁延书
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1