【技术实现步骤摘要】
物品名称治理方法和装置
本申请属于通信
,具体涉及一种物品名称治理方法和装置。
技术介绍
随着电商和微商的高速发展,快递业也得到了快速发展,因此,监管部门在面对形式各异、规则混乱的物品栏信息时,从其中提取真实有效的物物品名称称是项挑战。随着科学技术的不断发展,大数据技术日趋成熟,其中包括了对商物品名称称的治理方法。目前,传统的中文分词技术、关键词提取技术等相关技术,可以解决部分寄递物物品名称称的治理问题,也即是可以解决初步完成中文段落或短语的处理,但是针对海量的待处理数据,其效率较低,并且未对名词进行更详细的划分,导致精确度较低,进一步的,导致在商物品名称称的治理过程中,出现商物品名称称误识别已经识别效率较低的问题,增大了监管人员的工作量。
技术实现思路
本申请实施例的目的是提供一种物品名称治理方法和装置,能够解决现有技术中在商物品名称称的治理过程中,出现商物品名称称误识别已经识别效率较低的问题。为了解决上述技术问题,本申请是这样实现的:第一方面,本申请实施例提供了一种物品名称治理方
【技术保护点】
1.一种物品名称治理方法,其特征在于,包括:/n获取源数据;/n基于所述源数据进行初步分词处理,确定名词类分词;/n基于所述源数据调整关键词排名;/n将所述名词类分词和所述关键词排名进行融合,确定目标分词;/n在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区。/n
【技术特征摘要】
1.一种物品名称治理方法,其特征在于,包括:
获取源数据;
基于所述源数据进行初步分词处理,确定名词类分词;
基于所述源数据调整关键词排名;
将所述名词类分词和所述关键词排名进行融合,确定目标分词;
在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区。
2.根据权利要求1所述的方法,其特征在于,所述将所述名词类分词和所述关键词排名进行融合,确定目标分词之后,还包括:
在对所述目标分词进行物品名称校验,确定所述目标分词不是物品名称的情况下,将所述目标分词格式化。
3.根据权利要求2所述的方法,其特征在于,所述在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区,包括:
获取所述目标分词的记录数权重和特征权重;
基于所述记录数权重和所述特征权重设定初始化参数;
在所述初始化参数满足预设临界值条件的情况下,确定所述目标分词为物品名称,将所述目标分词放入缓存区。
4.根据权利要求3所述的方法,其特征在于,所述在对所述目标分词进行物品名称校验,确定所述目标分词不是物品名称的情况下,将所述目标分词格式化,包括:
在所述初始化参数不满足所述预设临界值条件的情况下,确定所述目标分词不是物品名称;
将所述目标分词格式化。
5.根据权利要求1所述的方法,其特征在于,所述获取源数据之前,还包括:
获取一批次的原始源数据;
将所述原始源数据根据对应的目标格式,封装为所述目标格式的源数据。
6.一种物品名称治理装...
【专利技术属性】
技术研发人员:雷小辉,王志华,喻波,王志海,安鹏,
申请(专利权)人:北京明朝万达科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。