物品名称治理方法和装置制造方法及图纸

技术编号:26892207 阅读:30 留言:0更新日期:2020-12-29 16:12
本申请公开了一种物品名称治理方法和装置,属于通信技术领域。所述方法包括:获取源数据;基于所述源数据进行初步分词处理,确定名词类分词;基于所述源数据调整关键词排名;将所述名词类分词和所述关键词排名进行融合,确定目标分词;在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区。本申请可以准确的确定出目标分词,并动态的对目标分词进行物品名称校验,提升了物品名称治理的精准率和准确率。

【技术实现步骤摘要】
物品名称治理方法和装置
本申请属于通信
,具体涉及一种物品名称治理方法和装置。
技术介绍
随着电商和微商的高速发展,快递业也得到了快速发展,因此,监管部门在面对形式各异、规则混乱的物品栏信息时,从其中提取真实有效的物物品名称称是项挑战。随着科学技术的不断发展,大数据技术日趋成熟,其中包括了对商物品名称称的治理方法。目前,传统的中文分词技术、关键词提取技术等相关技术,可以解决部分寄递物物品名称称的治理问题,也即是可以解决初步完成中文段落或短语的处理,但是针对海量的待处理数据,其效率较低,并且未对名词进行更详细的划分,导致精确度较低,进一步的,导致在商物品名称称的治理过程中,出现商物品名称称误识别已经识别效率较低的问题,增大了监管人员的工作量。
技术实现思路
本申请实施例的目的是提供一种物品名称治理方法和装置,能够解决现有技术中在商物品名称称的治理过程中,出现商物品名称称误识别已经识别效率较低的问题。为了解决上述技术问题,本申请是这样实现的:第一方面,本申请实施例提供了一种物品名称治理方法,该方法包括:...

【技术保护点】
1.一种物品名称治理方法,其特征在于,包括:/n获取源数据;/n基于所述源数据进行初步分词处理,确定名词类分词;/n基于所述源数据调整关键词排名;/n将所述名词类分词和所述关键词排名进行融合,确定目标分词;/n在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区。/n

【技术特征摘要】
1.一种物品名称治理方法,其特征在于,包括:
获取源数据;
基于所述源数据进行初步分词处理,确定名词类分词;
基于所述源数据调整关键词排名;
将所述名词类分词和所述关键词排名进行融合,确定目标分词;
在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区。


2.根据权利要求1所述的方法,其特征在于,所述将所述名词类分词和所述关键词排名进行融合,确定目标分词之后,还包括:
在对所述目标分词进行物品名称校验,确定所述目标分词不是物品名称的情况下,将所述目标分词格式化。


3.根据权利要求2所述的方法,其特征在于,所述在对所述目标分词进行物品名称校验,确定所述目标分词为物品名称的情况下,将所述目标分词放入缓存区,包括:
获取所述目标分词的记录数权重和特征权重;
基于所述记录数权重和所述特征权重设定初始化参数;
在所述初始化参数满足预设临界值条件的情况下,确定所述目标分词为物品名称,将所述目标分词放入缓存区。


4.根据权利要求3所述的方法,其特征在于,所述在对所述目标分词进行物品名称校验,确定所述目标分词不是物品名称的情况下,将所述目标分词格式化,包括:
在所述初始化参数不满足所述预设临界值条件的情况下,确定所述目标分词不是物品名称;
将所述目标分词格式化。


5.根据权利要求1所述的方法,其特征在于,所述获取源数据之前,还包括:
获取一批次的原始源数据;
将所述原始源数据根据对应的目标格式,封装为所述目标格式的源数据。


6.一种物品名称治理装...

【专利技术属性】
技术研发人员:雷小辉王志华喻波王志海安鹏
申请(专利权)人:北京明朝万达科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1