一种社会热点与商品品类的匹配方法组成比例

技术编号：20820190 阅读：36 留言：0更新日期：2019-04-10 06:00

本发明专利技术涉及一种社会热点与商品品类的匹配方法，其步骤：构建商品品类知识图谱；获取微博热门话题内容；将商品品类知识图谱与热门话题内容进行匹配：对于每一个实时产生的热门话题，获得该话题对应的微博内容，对于其中涉及到的知识图谱中的不同实体，采用不同的匹配方法，将匹配结果在已构建好的知识图谱上进行检索，得到最终的匹配得分；对商品标题与微博内容进行文本匹配；将商品品类知识图谱与热门话题内容的匹配结果与商品标题与微博内容的匹配结果相结合，得到最终的匹配结果。本发明专利技术能快速准确地找关联，并及时提供给有需求的店家，丰富店家的商品描述，提高商品销售效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种社会热点与商品品类的匹配方法
本专利技术涉及一种匹配方法，特别是关于一种社会热点与商品品类的匹配方法。
技术介绍
目前现有的电商平台中对商品与社会热点关联的挖掘并没有一个系统的算法，而是通过店主本身对时事热点情况的掌握，丰富与之相关的商品描述信息。社会热点话题的获取也是通过店主自己的了解。现有的方法虽然可以满足一部分用户的需求，但是存在许多不足。一方面，店家通过自己对时事热点的掌握修改商品描述需要一定的人力成本，另一方面，店家本身对于热点的了解不够全面，许多商家不了解的热点话题往往是顾客们热衷的话题。另外，店家自身获取信息的途径具有一定的滞后性，而许多热点话题也是具有时效性的，需要根据热点话题的变化对商品描述实时更新，这对于目前的方法是十分困难的。
技术实现思路
针对上述问题，本专利技术的目的是提供一种社会热点与商品品类的匹配方法，其能快速准确地找关联，并及时提供给有需求的店家，丰富店家的商品描述，提高商品销售效率。为实现上述目的，本专利技术采取以下技术方案：一种社会热点与商品品类的匹配方法，其包括以下步骤：1)构建商品品类知识图谱；2)获取微博热门话题内容；3)...

【技术保护点】
1.一种社会热点与商品品类的匹配方法，其特征在于包括以下步骤：1)构建商品品类知识图谱；2)获取微博热门话题内容；3)将商品品类知识图谱与热门话题内容进行匹配：对于每一个实时产生的热门话题，获得该话题对应的微博内容，对于其中涉及到的知识图谱中的不同实体，采用不同的匹配方法，将匹配结果在已构建好的知识图谱上进行检索，得到最终的匹配得分；4)对商品标题与微博内容进行文本匹配；5)将商品品类知识图谱与热门话题内容的匹配结果与商品标题与微博内容的匹配结果相结合，得到最终的匹配结果。

【技术特征摘要】
1.一种社会热点与商品品类的匹配方法，其特征在于包括以下步骤：1)构建商品品类知识图谱；2)获取微博热门话题内容；3)将商品品类知识图谱与热门话题内容进行匹配：对于每一个实时产生的热门话题，获得该话题对应的微博内容，对于其中涉及到的知识图谱中的不同实体，采用不同的匹配方法，将匹配结果在已构建好的知识图谱上进行检索，得到最终的匹配得分；4)对商品标题与微博内容进行文本匹配；5)将商品品类知识图谱与热门话题内容的匹配结果与商品标题与微博内容的匹配结果相结合，得到最终的匹配结果。2.如权利要求1所述方法，其特征在于：所述步骤1)中，商品品类知识图谱包括商品品类、三个实体和商品品类属性；每一个商品品类与三个实体关联，三个实体分别是泛产品品类、热搜词和品牌。3.如权利要求2所述方法，其特征在于：所述泛产品品类是将多个相近的品类集中起来，作为匹配过程中的一个整体，减少匹配品类总数，提高话题匹配成功的概率；所述热搜词是用户在搜索指定商品时输入的搜索词，热搜词具有词频的属性，不同的热搜词被使用的次数不同，使用次数高的热搜词更能够代表对应的品类，在匹配过程中匹配成功之后贡献的得分也相应更高。4.如权利要求1所述方法，其特征在于：所述步骤2)中，微博数据通过网络爬取，抓取最新的热搜微博内容；这些微博内容围绕同一个微博热搜榜话题，不仅包括话题发起者的微博，同时也包括微博用户对于该话题的相关评论，以及引用该话题的其他微博；将这些微博整理为文本，对其进行除噪过滤，将过滤之后的所有微博内容连接在一起，作为此话题对应的用于分析的微博内容，进而作为语料文本进行匹配。5.如权利要求4所述方法，其特征在于，所述过滤方法包括以下步骤：2.1)去除所有的标点符号以及表情非常用文本符号；2.2)去除所有以“@”开头以及冒号结尾的字符串；2.3)去除以“#”开头与结尾的字符串。6.如权利要求1所述方法，其特征在于：所述步骤3)中，匹配结果在已构建好的知识图谱上的检索方法如下：(1)泛产品品类识别检索：泛产品品类名称部分检索累计得分为体识别结果在知识图谱中检索的累计得分为(2)对品牌名称识别检索：直接使用实体识别结果，识别出所有类型为品牌的实体，将这些实体在知识图谱中进行检索，与每个商品品类下相关的所有品牌进行比对，累计得分为Scoreb；(3)热搜词识别检索：对于所有的商品品类，找到该品类下相关的所...

【专利技术属性】
技术研发人员：窦志成，左笑晨，黄真，文继荣，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人