一种基于大数据分析的标签分类方法技术

技术编号:20425406 阅读:23 留言:0更新日期:2019-02-23 08:34
本发明专利技术涉及一种基于大数据分析的标签分类方法,S11、对标签序列进行识别,抓取标签序列图像;S12、对所述标签序列图像进行深度识别,识别出标签序列图像中的字节;S13、对步骤S12中的标签序列图像根据字节进行分割,分割出子标签图像;S14、对分割后的标签序列图像进行特征提取,提取每个子标签图像中的数字特征,并将提取到的数字特征按着从前至后的顺序进行排列得到新的标签序列组合;S15、根据步骤S14中提取的标签图像中的数字特征得到的新的标签序列组合,匹配数据库中存储的标签分类规则,将新的标签序列组合进行标签分类;本发明专利技术具有分类精准、快捷的优点。

【技术实现步骤摘要】
一种基于大数据分析的标签分类方法
本专利技术属于标签分类
,具体涉及一种基于大数据分析的标签分类方法。
技术介绍
近年来,随着科技的飞速发展,大数据越来越倍受人们关注,大数据作为基于互联网科技的庞大数据库,为人们的生活带来诸多的便利,人们依据互联网大数据信息对产品的销售方式、销售规模、市场前景等进行精准的分析,从而便于管理人员进行快速、高效、准确的决策。同时,大数据需要庞大的数据库进行支持,在分析数据之前需要建立数据库,以商品为例,需要对商品进行准确分类,从而便于在销售商品是能够跟局商品独有的标签将销售出去的商品进行金准分类,以便于分析人员能够快速获知销售出的商品的种类,并根据日常的销售行为进行精准分析,快速分析出比较热门的销售商品。而在对商品进行分析时,对商品的标签快速、精准分类似是至关重要的,而目前的商品标签分类方法不够精准,导致实际运行时商品分类不够准确,从而导致后续的商品销售行为分类不够准确。
技术实现思路
本专利技术的目的是克服现有技术的不足而提供一种对标签快速、精准分类的基于大数据分析的标签分类方法。本专利技术的技术方案如下:一种基于大数据分析的标签分类方法,具体过程如下:S11、对标签序列进行识别,抓取标签序列图像;S12、对所述标签序列图像进行深度识别,识别出标签序列图像中的字节;S13、对步骤S12中的标签序列图像根据字节进行分割,分割出子标签图像;S14、对分割后的标签序列图像进行特征提取,提取每个子标签图像中的数字特征,并将提取到的数字特征按着从前至后的顺序进行排列得到新的标签序列组合;S15、根据步骤S14中提取的标签图像中的数字特征得到的新的标签序列组合,匹配数据库中存储的标签分类规则,将新的标签序列组合进行标签分类。进一步,在进行步骤S15时,采用MLAIM离散化算法将新的标签序列组合离散后进行逐级比对,直至最终将新的标签序列组合进行精细化分类。进一步,所述的基于大数据分析的标签分类方法,还包括建立标签分类数集,其具体的做法如下:S31、设定预定标签序列集合,设Y={y0、y1、y2、y3…yn},其中n为大于10且小于15的正整数,并且y0、y1、y2、y3…yn的取值均为0-9中的任一个;S32、定义集合Y中每个数值的的类别信息;S33、按步骤S32定义好的类别信息将标签序列集合进行分类。进一步,将新的标签序列组合离散后,将离散后的标签序列的每一位数字与预定的标签序列集合中相应位置的标签进行比对,逐一将新的标签序列组合的数值进行分类。进一步,定义新的标签序列集M={m0、m1、m2、m3…mi},其中i为大于10且小于15的正整数,并且m0、m1、m2、m3…mi的取值均为0-9中的任一个;将离散化后的新的标签序列的数字标签与预定标签序列集合中的数值进行逐一比对,将比对成功的数字标签归入到相应的类别中,进行下一数字标签的比对,直至完成所有标签序列的比对。与现有技术相比,本专利技术的有益效果是:本专利技术通过MLAIM离散化算法将新的标签序列组合离散后进行精确比对,从而提高标签识别分类的精确性;并且,在对新的标签序列组合进行比对过程中,将新的标签序列组合中的序列组合按着次序逐一与预定标签序列集合中的相应顺位的数值进行比对,从而有效提高标签分类的准确性和快捷性。具体实施方式下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种基于大数据分析的标签分类方法,具体过程如下:S11、对标签序列进行识别,抓取标签序列图像;S12、对所述标签序列图像进行深度识别,识别出标签序列图像中的字节;S13、对步骤S12中的标签序列图像根据字节进行分割,分割出子标签图像;S14、对分割后的标签序列图像进行特征提取,提取每个子标签图像中的数字特征,并将提取到的数字特征按着从前至后的顺序进行排列得到新的标签序列组合;S15、根据步骤S14中提取的标签图像中的数字特征得到的新的标签序列组合,匹配数据库中存储的标签分类规则,将新的标签序列组合进行标签分类。进一步,在进行步骤S15时,采用MLAIM离散化算法将新的标签序列组合离散后进行逐级比对,直至最终将新的标签序列组合进行精细化分类。进一步,所述的基于大数据分析的标签分类方法,还包括建立标签分类数集,其具体的做法如下:S31、设定预定标签序列集合,设Y={y0、y1、y2、y3…yn},其中n为大于10且小于15的正整数,并且y0、y1、y2、y3…yn的取值均为0-9中的任一个;S32、定义集合Y中每个数值的的类别信息;S33、按步骤S32定义好的类别信息将标签序列集合进行分类。进一步,将新的标签序列组合离散后,将离散后的标签序列的每一位数字与预定的标签序列集合中相应位置的标签进行比对,逐一将新的标签序列组合的数值进行分类。进一步,定义新的标签序列集M={m0、m1、m2、m3…mi},其中i为大于10且小于15的正整数,并且m0、m1、m2、m3…mi的取值均为0-9中的任一个;将离散化后的新的标签序列的数字标签与预定标签序列集合中的数值进行逐一比对,将比对成功的数字标签归入到相应的类别中,进行下一数字标签的比对,直至完成所有标签序列的比对。具体的在建立标签分类数集时,将集合Y={y0、y1、y2、y3…yn}中的每个数值进行逐一赋值定义,对y0取0-9的得到的不同的数值赋予最大类别,例如y0取0代表商品,接着对y1取0-9得到的不同的数值赋予次级类别,例如y1取0代表生活用品,y2取0代表洗漱用品,依次类推将集合Y中每一个数值取不同的数字时赋予不同的类别,最终使得集合Y代表不同种类的标签类别。在将集合M与集合Y中的数值进行比对时,用集合M中的m0与集合Y中的y0比对,比对时,例如m0赋予的值为3,在比对过程中m0比对出集合Y中y0的数值3代表的大类后,将集合M归入到y0取3时代表的类别,然后再进行m1的别对,例如m1取2,比对时将m1与集合Y中的y1进行比对,当比对出m1取2与集合Y中y1为2时代表的类别后,停止对y1的比对,将集合M归入到y0取3并且y1取2时代表的类别,同样的,将集合M中m2与集合Y中y2、集合M中m3与集合Y中y3进行比对,直至最终将集合M中mi与集合Y中yn进行比对结束,最终将M集合代表的数列进行标签精细化分类。本专利技术通过MLAIM离散化算法将新的标签序列组合离散后进行精确比对,从而提高标签识别分类的精确性;并且,在对新的标签序列组合进行比对过程中,将新的标签序列组合中的序列组合按着次序逐一与预定标签序列集合中的相应顺位的数值进行比对,从而有效提高标签分类的准确性和快捷性。尽管参照前述实施例对本专利技术进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
1.一种基于大数据分析的标签分类方法,其特征在于,具体过程如下:S11、对标签序列进行识别,抓取标签序列图像;S12、对所述标签序列图像进行深度识别,识别出标签序列图像中的字节;S13、对步骤S12中的标签序列图像根据字节进行分割,分割出子标签图像;S14、对分割后的标签序列图像进行特征提取,提取每个子标签图像中的数字特征,并将提取到的数字特征按着从前至后的顺序进行排列得到新的标签序列组合;S15、根据步骤S14中提取的标签图像中的数字特征得到的新的标签序列组合,匹配数据库中存储的标签分类规则,将新的标签序列组合进行标签分类。

【技术特征摘要】
1.一种基于大数据分析的标签分类方法,其特征在于,具体过程如下:S11、对标签序列进行识别,抓取标签序列图像;S12、对所述标签序列图像进行深度识别,识别出标签序列图像中的字节;S13、对步骤S12中的标签序列图像根据字节进行分割,分割出子标签图像;S14、对分割后的标签序列图像进行特征提取,提取每个子标签图像中的数字特征,并将提取到的数字特征按着从前至后的顺序进行排列得到新的标签序列组合;S15、根据步骤S14中提取的标签图像中的数字特征得到的新的标签序列组合,匹配数据库中存储的标签分类规则,将新的标签序列组合进行标签分类。2.如权利要求1所述的基于大数据分析的标签分类方法,其特征在于:在进行步骤S15时,采用MLAIM离散化算法将新的标签序列组合离散后进行逐级比对,直至最终将新的标签序列组合进行精细化分类。3.如权利要求2所述的基于大数据分析的标签分类方法,其特征在于,还包括建立标签分类数集,其具体的做法如下:S31、设定预...

【专利技术属性】
技术研发人员:洪创波
申请(专利权)人:广东潮庭集团有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1