联想词库的构建方法、装置及存储介质制造方法及图纸

技术编号:41222659 阅读:15 留言:0更新日期:2024-05-09 23:42
本申请公开了一种联想词库的构建方法、装置及存储介质,该方法通过获取电商平台中的商品信息,商品信息包括商品标题和商品类型,每个商品类型对应一个预设商品停用词词典,对商品标题进行预设粒度的分词,生成多个商品候选词,基于商品候选词,确定各个商品候选词的商品规范度;根据商品规范度、预设规范度阈值以及商品类型对应的商品停用词词典中的停用词,从商品候选词中确定目标联想词;根据目标联想词,生成物流领域的联想词库,实现了对商品候选词的商品规范度的量化,提高了商品标题的分析效率和商品候选词的准确性,从而能够根据商品规范度对商品候选词进行高效分析,提高了物流领域联想词库的质量和构建效率。

【技术实现步骤摘要】

本申请涉及自然语言处理,具体涉及一种联想词库的构建方法、装置及存储介质


技术介绍

1、随着人工智能的发展,搜索联想功能越来越成为互联网产品的一项基础服务功能。对于物流行业,搜索联想功能一方面可以提高客户在各种物流软件下单的使用体验;一方面可以规范客户填写的托寄物,减轻快递员对托寄物二次检验的压力,提供性价比更高的物流配送服务。

2、然而,搜索联想功能均是通过在联想词库中进行的,现有的物流领域的联想词库存在词库质量不高,且本领域的词库存在较多不规范的词语、无意义或不相关的词语,例如输入“裙”,会联想出“裙黑x”、“裙粉x”、“裙黑m”,这类联想词语,对于物流运输环节既无指导意义,又会干扰物流信息处理。此外,这类词不仅占用存储空间,还会浪费带宽资源,降低了搜索准确性,影响搜索速度,因此,构建一个全面且规范的物流行业联想词库显得尤为重要。


技术实现思路

1、本申请实施例提供一种联想词库的构建方法、装置及存储介质,以解决物流领域的联想词库均存在词库质量不高,且本领域的词库存在较多不规范的词语,导致物流下本文档来自技高网...

【技术保护点】

1.一种联想词库的构建方法,其特征在于,所述联想词库的构建方法包括:

2.根据权利要求1所述的联想词库的构建方法,其特征在于,所述对所述商品标题进行预设粒度的分词,生成多个商品候选词,包括:

3.根据权利要求2所述的联想词库的构建方法,其特征在于,所述对所述商品标题进行预设粒度的分词,生成多个商品候选词,包括:

4.根据权利要求1-3任一项所述的联想词库的构建方法,其特征在于,所述基于所述商品候选词,确定各个所述商品候选词的商品规范度,包括:

5.根据权利要求4所述的联想词库的构建方法,其特征在于,所述确定所述商品候选词在所述商品标题中的邻...

【技术特征摘要】

1.一种联想词库的构建方法,其特征在于,所述联想词库的构建方法包括:

2.根据权利要求1所述的联想词库的构建方法,其特征在于,所述对所述商品标题进行预设粒度的分词,生成多个商品候选词,包括:

3.根据权利要求2所述的联想词库的构建方法,其特征在于,所述对所述商品标题进行预设粒度的分词,生成多个商品候选词,包括:

4.根据权利要求1-3任一项所述的联想词库的构建方法,其特征在于,所述基于所述商品候选词,确定各个所述商品候选词的商品规范度,包括:

5.根据权利要求4所述的联想词库的构建方法,其特征在于,所述确定所述商品候选词在所述商品标题中的邻接字丰富度,并将所述邻接字丰富度作为第一规范度,...

【专利技术属性】
技术研发人员:林鹏珊曾庆维
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1