商家分类方法、装置及电子设备制造方法及图纸

技术编号:16038959 阅读:23 留言:0更新日期:2017-08-19 20:50
本申请公开了一种商家分类方法、装置及电子设备。其中该方法包括:接收待分类的商家的商家名和至少一个商品名;基于预设的第一数据集,获取所述商家名对应的初始分类信息;基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息;基于所述商家名对应的初始分类信息以及所述至少一个商品名对应的初始分类信息确定所述商家所属的类别。采用本申请的技术方案,能够有效提升对商家分类的准确率。

【技术实现步骤摘要】
商家分类方法、装置及电子设备
本专利技术涉及分类
,具体而言,涉及一种商家分类方法、装置及电子设备。
技术介绍
商家分类是O2O等互联网模式中的重要问题,通过互联网平台上入驻的商家进行分类,可实现对商家更好的管理,也能大大方便客户对商家的查找及迅速了解。现有技术中,一般通过人工分类或机器自动分类实现。人工分类效率低且成本较高。机器自动分类一般仅利用商家名称作为分类依据,分类准确率较低。
技术实现思路
有鉴于此,本专利技术提供一种商家分类方法、装置及电子设备,适用于商家分类,能够有效提升对商家分类的准确率。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本专利技术的一方面,提供一种商家分类方法,包括:接收待分类的商家的商家名和至少一个商品名;基于预设的第一数据集,获取所述商家名对应的初始分类信息;基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息;基于所述商家名对应的初始分类信息以及所述至少一个商品名对应的初始分类信息确定所述商家所属的类别。根据本专利技术的另一方面,还提供一种商家分类装置,其包括:接收模块,用于接收待分类的商家的商家名和至少一个商品名;第一获取模块,用于基于预设的第一数据集,获得所述商家名对应的初始分类信息;第二获取模块,用于基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息;确定模块,用于基于所述商家名对应的初始分类信息以及所述至少一个商品名对应的初始分类信息确定所述商家所属的类别。根据本专利技术的再一方面,还提供一种电子设备,包括:处理器;以及存储器,其上存储有可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序以实现如上所述方法的步骤。根据本专利技术的再一方面,还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤在本专利技术实施方式中,首先基于预设的第一数据集,获取商家名对应的初始分类信息,并基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息,然后结合商家名对应的初始分类信息以及至少一个商品名对应的初始分类信息确定商家所属的类别。这种方式综合考虑了商家的商家名和商品内容(包括至少一个商品名),从而可在分类时减少误判,提高分类准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本专利技术。附图说明通过参照附图详细描述其示例实施例,本专利技术的上述和其它目标、特征及优点将变得更加显而易见。图1是根据本专利技术实施方式示出的一种商家分类方法的流程图;图2示意性示出了商家数据的例子;图3是根据本专利技术实施方式示出的一种商家分类装置的框图;图4是根据本专利技术实施方式示出的另一种商家分类装置的框图;图5是根据本专利技术实施方式示出的一种电子设备的框图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本专利技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本专利技术的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本专利技术的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本专利技术的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本专利技术的各方面变得模糊。图1是根据本专利技术实施方式示出的一种商家分类方法的流程图。在本专利技术实施方式中,商家分类方法可包括:步骤S101,接收待分类的商家的商家名和至少一个商品名。例如,在少一个商品名可以是餐饮商家提供的一种或多种菜品的菜名,也可以是服装商家提供的一种或多种衣服的款式名。步骤S102,基于预设的第一数据集,获取商家名对应的初始分类信息。步骤S103,基于预设的第二数据集,获取至少一个商品名对应的初始分类信息。步骤S104,基于商家名对应的初始分类信息以及至少一个商品名对应的初始分类信息确定商家所属的类别。商家分类是O2O等互联网模式中的重要问题,通过互联网平台上入驻的商家进行分类,可实现对商家更好的管理,也能大大方便客户对商家的查找及迅速了解。现有技术中,一般通过人工分类或机器自动分类实现。人工分类效率低且成本较高。机器自动分类一般仅利用商家名称作为分类依据,分类准确率较低。在本专利技术实施方式中,将商家名称及商家的商品名结合起来,从而提高了分类准确率。也就是说,本申请实施例提供的分类方法不仅仅是基于商家名称来进行分类,而且还考虑了商家提供的一个或多个商品名,从而使得分类更加准确。在一个实施例中,步骤S103可以包括:基于预设的第二数据集,获得所述至少一个商品名在各个类别下出现的概率信息;其中,所述第二数据集包括多个商品名特征词及各个商品名特征词在各个类别下出现的概率信息;根据所述至少一个商品名在各个类别下出现的概率信息,计算所述各个类别的第二得分作为所述至少一个商品名对应的初始分类信息。第二数据集可以预先设置,可以包括多个商家对应的商品名特征词及各个商品名特征词在各个类别下出现的概率信息。例如,可以对已有的商品名进行预处理,例如归一化处理,去除商品名中体现规格尺寸的信息、广告性词语等,以使商品名更规整。例如,“大号汉堡”、“中号汉堡”就要将“大号”、“中号”去除,将其统一为“汉堡”。将归一化后的商品名作为商品名特征词,通过朴素贝叶斯方法对多个商家的商品名特征词进行处理得到第二数据集。对于步骤S101中接收到的待分类的商家的至少一个商品名,类似地也可以进行预处理,例如进行归一化处理,以去除商品名中的一些体现商品规格的词或者广告词,避免由于这些词的存在使得无法在第二数据集中匹配到商品名特征词。例如,商家提供的商品名为“经典过桥米线”,则可以通过归一化处理去除词语“经典”。又例如,商家提供的商品名为“巨无霸披萨”,则可以去除带有广告性质的词“巨无霸”。在上述实施例中,在接收到所述待分类的商家的商家名和至少一个商品名之后,还可以包括:基于商家名获得特征词。例如,可以提取商家名中的一个或多个品类词(即能够体现商家类别的词)作为特征词。又例如,也可以不是直接提取商家名中的品类词,而是基于商家名中的词语获得对应的品类词作为特征词。例如,商家名为“海底捞”,商家名中没有明确的体现品类的词,则可以基于该商家名获得对应的品类词为“火锅”。步骤S102可以包括:基于所述预设的第一数据集,获得所述特征词在各个类别下出现的概率信息,其中,所述第一数据集包括多个特征词及各个特征词在各个类别下出现的概率信息;根据所述待分类的商家名中获得的特征词在各个类别下出现的概率信息,计算所述各个类别的第一得分作为所述商家名对应的初始分类信息。通过提取多个商家的商家名中的品类词作为特征词并计算各个特征词在各个类别下出现的概率信息可以预先获得第一数据集。例如,可以通过朴素贝叶斯方法对多个商家的商家名中的品类词进行处理得到第一数据集。关于第一数据集的获得方式后文将本文档来自技高网...
商家分类方法、装置及电子设备

【技术保护点】
一种商家分类方法,其特征在于,包括:接收待分类的商家的商家名和至少一个商品名;基于预设的第一数据集,获取所述商家名对应的初始分类信息;基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息;基于所述商家名对应的初始分类信息以及所述至少一个商品名对应的初始分类信息确定所述商家所属的类别。

【技术特征摘要】
1.一种商家分类方法,其特征在于,包括:接收待分类的商家的商家名和至少一个商品名;基于预设的第一数据集,获取所述商家名对应的初始分类信息;基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息;基于所述商家名对应的初始分类信息以及所述至少一个商品名对应的初始分类信息确定所述商家所属的类别。2.根据权利要求1所述的方法,其特征在于,所述基于预设的第二数据集,获取所述至少一个商品名对应的初始分类信息,包括:基于预设的第二数据集,获得所述至少一个商品名在各个类别下出现的概率信息;其中,所述第二数据集包括多个商品名特征词及各个商品名特征词在各个类别下出现的概率信息;根据所述至少一个商品名在各个类别下出现的概率信息,计算所述各个类别的第二得分作为所述至少一个商品名对应的初始分类信息。3.根据权利要求2所述的方法,其特征在于,还包括:对接收到的待分类的商家的至少一个商品名进行归一化处理得到对应的商品名特征词。4.根据权利要求1所述的方法,其特征在于,在接收到所述待分类的商家的商家名和至少一个商品名之后,还包括:基于所述商家名获得特征词。5.根据权利要求4所述的方法,其特征在于,所述基于预设的第一数据集,获得所述商家名对应的初始分类信息,包括:基于所述预设的第一数据集,获得所述商家名对应的特征词在各个类别下出现的概率信息,其中,所述第一数据集包括多个特征词及各个特征词在各个类别下出现的概率信息;根据所述待分类的商家名中获得的特征词在各个类别下出现的概率信息,计算所述各个类别的第一得分作为所述商家名对应的初始分类信息。6.根据权利要求1所述...

【专利技术属性】
技术研发人员:张伟鹏李彪
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1