【技术实现步骤摘要】
基于经验学习的商品归一和检索系统
本专利技术涉及商品信息归一
,具体是基于经验学习的商品归一和检索系统。
技术介绍
经验学习是指从经验或从实干中学习,广义地说,任何学习都是一种经验的过程,经验学习更强调通过具体的做达到行为改变的目的。在SaaS服务的业务场景下,每个客户都会维护自己的商品档案,对同一个商品实体的判别通常可以通过EAN(商品69码)识别,但实际业务场景下客户的管理水平不同,档案资料的完整性各不相同,这给数据治理带来了极大的挑战。所以,人们急需一种基于经验学习的商品归一和检索系统来解决上述问题。
技术实现思路
本专利技术的目的在于提供基于经验学习的商品归一和检索系统,以解决现有技术中提出的问题。为实现上述目的,本专利技术提供如下技术方案:基于经验学习的商品归一和检索系统,该系统包括用于对商品基本档案进行存储的商品档案库、用于对商品基本档案进行查询和补充的客户端、用于对商品基本档案完善过程中的归一化处理以及用于对完善的商品基本档案进行查询和检索的检索模块;所 ...
【技术保护点】
1.基于经验学习的商品归一和检索系统,其特征在于:该系统包括用于对商品基本档案进行存储的商品档案库、用于对商品基本档案进行查询和补充的客户端、用于对商品基本档案完善过程中的归一化处理以及用于对完善的商品基本档案进行查询和检索的检索模块;/n所述客户端的输出端电性连接归一化处理的输入端,所述归一化处理的输出端电性连接商品档案库的输入端,所述商品档案库通过信息同步将信息发送至其他客户端,形成良性反馈,所述商品档案库通过匹配模块对检索模块的检索信息进行匹配。/n
【技术特征摘要】
1.基于经验学习的商品归一和检索系统,其特征在于:该系统包括用于对商品基本档案进行存储的商品档案库、用于对商品基本档案进行查询和补充的客户端、用于对商品基本档案完善过程中的归一化处理以及用于对完善的商品基本档案进行查询和检索的检索模块;
所述客户端的输出端电性连接归一化处理的输入端,所述归一化处理的输出端电性连接商品档案库的输入端,所述商品档案库通过信息同步将信息发送至其他客户端,形成良性反馈,所述商品档案库通过匹配模块对检索模块的检索信息进行匹配。
2.根据权利要求1所述的基于经验学习的商品归一和检索系统,其特征在于:所述归一化处理通过短文本拆分模块、关键词提取模块、行业词汇积累模块和商品归一化模块共同实现;
所述短文本拆分模块的输出端电性连接关键词提取模块的输入端,所述行业词汇积累模块的输出端电性连接关键词提取模块的输入端,所述关键词提取模块的输出端电性连接商品归一模块的输入端;
所述短文本拆分模块用于对客户端输入的关于商品基本档案的部分描述进行拆分,形成若干个对商品基本档案描述的词汇,所述关键词提取模块用于将短文本拆分模块所拆分的若干个对基本档案描述的词汇进行关键词的提取,所述关键词是指未在对商品的基本档案描述过程中出现的词汇,所述行业词汇积累模块用于对行业中会出现的描述词汇进行积累和收集,所述商品归一模块用于对关键词提取模块所提取的关键词进行归一处理,完善商品的基本档案并存储在商品档案库中。
3.根据权利要求2所述的基于经验学习的商品归一和检索系统,其特征在于:所述短文本拆分模块包括对短文本的初步拆分和细致拆分;
所述初步拆分是指根据传统的对于商品的描述以及助词在短文本中出现的位置将短文本初步拆分成若干个单元,这若干个单元单独之间不能作为对商品基本档案描述的关键词,所述细致拆分是指根据词库对初步拆分之后的若干个单元中的每个单元再次进行拆分成若干个小单元,使得再次拆分之后的若干个小单元都能作为单独的关键词对商品基本档案进行描述。
4.根据权利要求3所述的基于经验学习的商品归一和检索系统,其特征在于:所述初步拆分通过字符数识别单元、助词匹配单元、助词库和拆分初确认单元实现,所述细致拆分通过词汇匹配单元、词库和拆分确认单元实现;
所述字符数识别单元的输出端电性连接助词匹配单元的输入端,所述助词库的输出端电性连接助词匹配单元的输入端,所述助词匹配单元的输出端电性连接拆分初确认单元的输入端,所述拆分初确认单元的输出端电性连接词汇匹配单元的输入端,所述词库的输出端电性连接词汇匹配单元的输入端,所述词汇匹配单元的输出端电性连接拆分确认单元的输入端;
所述字符数识别单元用于对客户端所发布的对商品基本档案的部分描述短文本的总字符进行识别和确认,所...
【专利技术属性】
技术研发人员:张可欣,罗阳,汤定一,
申请(专利权)人:舟谱数据技术南京有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。