一种基于孪生Transformer模型和知识图谱结合的商品推荐方法、系统技术方案

技术编号:37214621 阅读:11 留言:0更新日期:2023-04-20 23:03
本发明专利技术提供一种基于孪生Transformer模型和知识图谱结合的商品推荐方法、系统和存储介质,所述方法包括:解析用户的症状描述得到用户的购买意向;解析用户的商品浏览动作得到用户的购物偏好;对现有的医药知识文本进行命名实体识别、语义识别和关系识别,得到医药知识图谱;根据孪生Transformer模型基于医药知识图谱进行潜在知识发现,其中知识发现指发掘两个药品商品之间的可替代性或两个症状之间的相关性;根据构建的医药知识图谱和采集的用户行为进行高精准度的药品商品推荐,并根据用户的行为对推荐结果进行反馈。本发明专利技术公开的技术方案可以提高药品商品的线上零售推荐的准确率,提高用户搜索购买适宜药品的便捷性和时效性。性。性。

【技术实现步骤摘要】
一种基于孪生Transformer模型和知识图谱结合的商品推荐方法、系统


[0001]本专利技术涉及计算机网络
基于深度学习在推荐算法上的应用,尤其涉及一种基于孪生Transformer模型和知识图谱结合的商品推荐方法、系统和非暂态计算机可读存储介质。

技术介绍

[0002]随着互联网与生活的结合逐渐紧密,线上零售在人们的日常生活中也越发普及。在各个线上零售平台的竞争中,能够准确向用户推荐所需商品的能力逐渐成为衡量平台是否好用的标准,因此,线上零售推荐所扮演的角色越来越重要,给企业带来的价值也越来越多。
[0003]但是,目前应用于线上零售推荐的算法,主要面向快消、日用、服装、电子产品等商品,这类商品的特性往往都是和用户自身的兴趣点强相关,因此,所使用的推荐算法的侧重点都是在挖掘用户自身的兴趣方面,大多数都是基于“猜其所想,投其所好”的建模思想。
[0004]然而,在医药保健品零售推荐的方面,现有的推荐算法往往无法及时挖掘出用户的真正需求和意图。这是因为医药保健品和一般商品不同,用户只有在生病、体弱等状态下,才会产生购物需求。实际上,用户在进入购药流程时,是带有明确需求的,针对以往没有罹患过的病症对应的药品的购买需求与历史记录关联较小。这就意味着,现有的依靠挖掘用户历史行为的依据兴趣点的推荐算法,推荐的商品和用户本次的需求关联不大。因此,现有的商品推荐算法在实际应用中带来的收益微乎其微,大部分用户不会产生明显的复购行为,所以根据历史购物记录挖掘的兴趣点进行推荐的相关药品是没有很大帮助的。
>[0005]在实际医药保健品的零售推荐场景下,要求算法具备实时挖掘用户需求的功能。用户在进入购药流程后,产生了每一个行为,算法都要充分挖掘并利用,并以此预测出用户真正的需求。

技术实现思路

[0006]为解决以上问题,本专利技术提供一种用于医药商品推荐的推荐方法和推荐系统。具体来说,是将知识图谱应用到推荐系统上,利用自训练的医药知识图谱带来的专业性知识,来弥补用户行为的指向性上的不足,从而使得本专利技术所述推荐方法和推荐系统可以在用户行为数据量较少的情况下,实时地挖掘到用户的需求,并提供高质量的商品推荐。
[0007]所述推荐方法包括以下步骤:对用户输入搜索框的症状描述进行解析,得到可以用于检索的症状标签;对用户浏览商品的动作进行采集,得到可以用于描述用户画像的用户偏好数据;根据网络上已有的医药知识文本进行学习,得到药品与症状的对应关系,形成可以用于查询已有关系和发现潜在关系的医药知识图谱;根据用户提供的用于检索的症状标签和用户偏好数据以及知识图谱,向用户推荐合适的药品商品;根据用户对推荐的药品商品的浏览动作,调整推荐方法。
[0008]优选的,所述解析用户症状描述的过程包括:对用户描述症状输入的自然语言字符串进行语义分割,得到可以用于检索的症状描述关键词和适用年龄的数据。
[0009]优选的,所述解析用户症状描述的过程包括:对用户输入的自然语言字符串进行规范化纠正的过程,其中所述规范化纠正包括繁体字到简体字的转换、同音异意字的转换、错别字的纠正。
[0010]优选的,所述用户行为分析为采集用户点击、浏览、停留时间的数据,根据采集到的用户数据可以绘制出用户画像,最后根据不同的用户画像,为用户赋予不同的推荐标签。
[0011]优选的,所述采集用户浏览推荐商品或初始商品的动作得到用户偏好数据的过程包括:采集用户点击、浏览、停留时间的数据;采集用户长按反馈不感兴趣或屏蔽此类药品的数据;采集用户浏览药品商品适用人群的数据。
[0012]优选的,采集并分析用户进入购药流程后的用户行为可以用于预测用户当前的需求并对商品页面的商品展示顺序进行重排。
[0013]优选的,所述医药知识图谱的构建过程包括:对药品命名实体进行识别,所述药品命名实体的识别包括药品实体标准化;对症状实体进行识别,所述症状实体的识别包括症状实体间的关联;对药品和症状的对应关系进行识别,所述对应关系的识别包括根据已有的医药知识文本进行关系抽象,和根据医药知识图谱的症状实体间的关系进行知识发现。优选的,孪生Transformer学习模块与知识图谱的结合可以用于发掘潜在的实体关系,这一环节称为知识发现环节。
[0014]优选的,在分析用户行为时,针对各不同的用户标签,可以对相应权重进行调整,从而实现对用户的精准画像和推荐。
[0015]优选的,所述向用户推荐合适的药品商品的过程包括:基于所述解析用户症状描述的过程得到的症状描述关键词和适用年龄的数据;基于用户偏好数据;基于医药知识图谱的实体及实体间的关系,对用户进行药品商品的推荐。
[0016]优选的,根据用户对推荐的药品商品的浏览动作,对推荐方法进行优化,所述优化方法包括:对推荐商品进行列表排序,根据用户的浏览动作可以调整推荐商品的列表排序次序;对推荐商品及其对应标签进行生命周期管理,根据用户的浏览动作控制所述生命周期的持续或终止;根据用户的浏览动作对推荐方法进行反馈,决定是否需要更新推荐方法使用的推荐模型。
[0017]优选的,在维护推荐模块时,对不同的推荐板块制定不同的规则或增加对各类商品的生命周期管理,可以避免无意义或超时的长时间没有被浏览的推荐商品被反复推荐,避免消耗后台的计算量,提升各标签的可维护性。
[0018]优选的,当孪生Transformer模块输出的数据表相互关联时,可以使用只是图谱嵌入模块进行知识嵌入,从而实现孪生Transformer模块的输出数据的可视化表征,作为下游推荐模块的输入的一种。
[0019]优选的,在训练推荐模块的过程中,采用对抗思想对模型进行训练,从而动态调整易混淆样本和不易混淆样本的学习次数,实现模型的平衡。
[0020]优选的,在推荐方法中,对作为推荐结果的多个药品商品,采用排序验证的方法进行优化,即排序靠前的商品视为大概率会被点击浏览,若实际未被点击浏览,则向后调整其在排序队列中的位置,从而实现实时的算法优化。
[0021]优选的,在最后将商品推荐给用户之前,会为每个用户维护一个有序的推荐队列,增量更新队列中推荐商品因用户操作而实时变化的得分,从而对推荐队列中的商品进行去重处理。
[0022]优选的,在实际推荐给用户商品时,用户对埋点商品的点击也会用于决定给出当前推荐结果的推荐算法是否需要进化或者淘汰。
[0023]本专利技术的上述方案与现有技术相比,有以下有益效果:通过上述技术方案,在对用户购药需求进行推荐时,让推荐系统可以在用户行为数据量较少的情况下,实时地挖掘到用户的需求,并提供高质量的商品推荐。相较于传统的主流推荐算法采用的离线计算,本专利技术所述技术方案在实时计算和分析用户的需求方面具有更高优势。
[0024]在用户进入购药程序时,首先记录用户在搜索框中搜索的药品名称或不适症状,将这一步骤产生的数据记录为此次用户的用户行为数据,并将此部分数据提取关键词后传入智能推荐方法进行关键词查找和分析。在智能推荐方法的分析过程中,首先从用户输入的症状描本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于孪生Transformer模型和知识图谱结合的商品推荐方法,所述方法其特征在于:对用户在搜索框的输入进行语义分割,以分析用户实际的需求,得到可以用于检索的症状标签,并进一步对用户进行画像;对用户浏览商品的动作进行采集,得到可以用于描述用户画像的用户偏好数据;使用Transformer模型对自然语言记载的医药知识文本进行学习提取出药品和症状标签,并对标签进行规范化,得到药品与症状的对应关系,形成可以用于查询已有关系和发现潜在关系的医药知识图谱;根据用户提供的用于检索的症状标签和用户偏好数据以及知识图谱,向用户推荐合适的药品商品;根据用户对推荐的药品商品的浏览动作,调整推荐策略。2.根据权利要求1所述推荐方法,其特征在于,所述解析用户症状描述的过程包括:对用户描述症状输入的自然语言字符串进行语义分割,得到可以用于检索的症状描述关键词和适用年龄的数据。3.根据权利要求2所述的推荐方法,其特征在于,所述解析用户症状描述的过程包括:对用户输入的自然语言字符串进行规范化纠正的过程,其中所述规范化纠正包括繁体字到简体字的转换、同音异意字的转换、错别字的纠正。4.根据权利要求2所述的推荐方法,其特征在于,根据解析所得的数据对用户当前的购买需求进行预测。5.根据权利要求2所述推荐方法,其特征在于,所述检索症状描述关键词的过程,在根据现有的医药知识文本生成的医药知识图谱中进行。6.根据权利要求1所述推荐方法,其特征在于,所述采集用户浏览推荐商品或初始商品的动作得到用户偏好数据的过程包括:采集用户点击、浏览、停留时间的数据;采集用户长按反馈不感兴趣或屏蔽此类药品的动作;采集用户浏览药品商品适用人群的数据。7.根据权利要求1所述推荐方法,其特征在于,所述医药知识图谱的构建过程包括:对药品命名实体进行识别,所述药品命名实体的识别包括药品实体标准化;对症状实体进行识别,所述症状实体的识别包括症状实体间的关联;对药品和症状的对应关系进行识别,所述对应关系的识别包括根据已有的医药知识文本进行关系抽象,和根据医药知识图谱的症状实体间的关系进行知识发现。8.根据权利要求6所述推荐方法,其特征在于,所述知识发现过程为使用...

【专利技术属性】
技术研发人员:肖慧彬
申请(专利权)人:瓴创北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1