一种订单日志处理方法和装置制造方法及图纸

技术编号:33138564 阅读:29 留言:0更新日期:2022-04-22 13:47
本发明专利技术公开了一种订单日志处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取历史业务数据,以从所述历史业务数据中提取订单日志的生成原因以及与所述生成原因对应的订单日志;根据所述订单日志,构建与所述生成原因对应的因果关系图谱,所述因果关系图谱的节点指示了一个或多个订单日志,所述因果关系图谱的边指示了所述订单日志之间的时间关联度及因果关联度;在用户填写订单日志的情况下,调用与待填写订单日志的生成原因对应的因果关系图谱,以确定用以推荐给所述用户的待填写日志内容。该实施方式提高了订单日志填写的效率,辅助效果良好。辅助效果良好。辅助效果良好。

【技术实现步骤摘要】
一种订单日志处理方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种订单日志处理方法和 装置。

技术介绍

[0002]随着电子商务的发展,在线客服系统已经成为线上销售、售后服 务不可或缺的工具,且常需要基于在线客服的内容填写订单日志,以 实现对订单的管理。
[0003]目前,常用的订单日志填写方式主要包括以下两种:基于有监督 算法模型进行订单日志填写;基于无监督算法模型进行订单日志填写。
[0004]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题: 有监督算法模型训练需要大量人工标注,成本高;无监督算法模型采 用的训练数据噪声大,输出结果不易被采纳;此外,无论何种填写方 式均未对日志的生成原因及发展脉络进行梳理,订单日志辅助填写效 果差。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种订单日志处理方法和装置, 能够通过梳理订单日志的生成原因以及发展脉络构建因果关系图,并 采用因果关系图谱辅助订单日志填写,既不需要人工进行数据标注, 又避免了训练数据噪声大的问题,提高了订单日志的填写效率,且辅 助效果良好。
[0006]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种订 单日志处理方法,包括:
[0007]获取历史业务数据,以从所述历史业务数据中提取订单日志的生 成原因以及与所述生成原因对应的订单日志;
[0008]根据所述订单日志,构建与所述生成原因对应的因果关系图谱, 所述因果关系图谱的节点指示了一个或多个订单日志,所述因果关系 图谱的边指示了所述订单日志之间的时间关联度及因果关联度;
[0009]在用户填写订单日志的情况下,调用与待填写订单日志的生成原 因对应的因果关系图谱,以确定用以推荐给所述用户的待填写日志内 容。
[0010]可选地,所述根据所述订单日志,构建与所述生成原因对应的因 果关系图谱,包括:
[0011]对于同一所述生成原因下的任意两个订单日志,根据所述订单日 志的创建时间、所述生成原因对应的订单日志追踪时间,确定所述两 个订单日志之间的时间关联度;
[0012]在所述时间关联度大于阈值时间关联度的情况下,根据所述两个 订单日志中的句子、同时出现在所述两个订单日志中的词语数量,确 定所述两个订单日志之间的因果关联度;
[0013]在所述因果关联度大于阈值因果关联度的情况下,以所述订单日 志为节点,按照所述订单日志创建的先后顺序连接所述订单日志,以 生成所述因果关系图谱。
[0014]可选地,所述在用户填写订单日志的情况下,调用与待填写订单 日志的生成原因对应的因果关系图谱,以确定用以推荐给所述用户的 待填写日志内容,包括:
[0015]基于所述待填写订单日志对应的订单号,从所述因果关系图谱中 确定出与所述订单号对应的最新创建的订单日志;
[0016]根据所述订单日志与所述因果关系图谱中其他订单日志的因果关 联度设定剪枝阈值;
[0017]根据所述剪枝阈值,基于图谱剪枝算法,从所述因果关系图谱中 确定出用以推荐给所述用户的一个或多个订单日志。
[0018]可选地,在根据所述订单日志,构建所述生成原因对应的因果关 系图谱之前,还包括:
[0019]对所述生成原因对应的订单日志进行聚类,以生成所述生成原因 对应的聚类簇;
[0020]确定所述聚类簇中心预设半径范围内的一个或多个订单日志为所 述生成原因对应的标准日志,以根据所述标准日志,构建所述生成原 因对应的因果关系图谱。
[0021]可选地,所述对所述生成原因对应的订单日志进行聚类,以生成 所述生成原因对应的聚类簇,包括:
[0022]基于TF

IDF算法及TextRank算法,从所述订单日志中提取所述订 单日志对应的一个或多个关键词;
[0023]对所述关键词的编码进行聚类,以生成所述聚类簇。
[0024]可选地,在对所述生成原因对应的订单日志进行聚类,以生成所 述生成原因对应的聚类簇之前,还包括:
[0025]删除所述订单日志中的下述一种或多种内容:标点符号、停用词、 日期、货币符号、出现频率高于第一阈值频率的一个或多个词语、出 现频率低于第二阈值频率的一个或多个词语。
[0026]可选地,还包括:
[0027]基于所述订单日志中的一个或多个关键词,构建与所述生成原因 对应的联想词库;
[0028]在用户填写订单日志的情况下,调用与待填写订单日志的生成原 因对应的联想词库,以从所述联想词库中确定出用以推荐给所述用户 的一个或多个关键词。
[0029]可选地,在根据所述标准日志,构建所述生成原因对应的因果关 系图谱之前,还包括:
[0030]构建与所述生成原因对应的原因向量;
[0031]构建与所述标准日志对应的日志向量;
[0032]计算任意所述原因向量与所述标准向量的相似度,以根据所述相 似度的最大值,重新确定所述标准日志对应的所述生成原因。
[0033]可选地,基于ALBERT模型生成所述标准日志对应的日志向量。
[0034]可选地,所述构建与所述生成原因对应的原因向量,包括:
[0035]获取所述生成原因对应的一个或多个类别代表词;
[0036]根据所述类别代表词对应的一个或多个同义词或近义词,确定所 述类别代表词在原因词库下的一个或多个词语;
[0037]根据所述生成原因中实体词与所述类别代表词下一个或多个词语 的词相似度,将所述实体词扩充至所述原因词库;
[0038]基于扩充后的所述原因词库,构建与所述生成原因对应的原因向 量。
[0039]可选地,还包括:
[0040]在将所述实体词扩充至所述原因词库之前,根据所述实体词在所 述生成原因中的出现频率、所述实体词在所有所述生成原因中的出现 频率,计算所述实体词对应的质量评分;
[0041]在所述质量评分大于阈值质量评分的情况下,将所述实体词扩充 至所述原因词库。
[0042]为实现上述目的,根据本专利技术实施例的另一个方面,提供了一种 订单日志处理装置,包括:数据获取模块、图谱构建模块、图谱调用 模块;其中,
[0043]所述数据获取模块,用于获取历史业务数据,以从所述历史业务 数据中提取订单日志的生成原因以及与所述生成原因对应的订单日 志;
[0044]所述图谱构建模块,用于根据所述订单日志,构建与所述生成原 因对应的因果关系图谱,所述因果关系图谱的节点指示了一个或多个 订单日志,所述因果关系图谱的边指示了所述订单日志之间的时间关 联度及因果关联度;
[0045]所述图谱调用模块,用于在用户填写订单日志的情况下,调用与 待填写订单日志的生成原因对应的因果关系图谱,以确定用以推荐给 所述用户的待填写日志内容。
[0046]可选地,所述根据所述订单日志,构建与所述生成原因对应的因 果关系图谱,包括:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种订单日志处理方法,其特征在于,包括:获取历史业务数据,以从所述历史业务数据中提取订单日志的生成原因以及与所述生成原因对应的订单日志;根据所述订单日志,构建与所述生成原因对应的因果关系图谱,所述因果关系图谱的节点指示了一个或多个订单日志,所述因果关系图谱的边指示了所述订单日志之间的时间关联度及因果关联度;在用户填写订单日志的情况下,调用与待填写订单日志的生成原因对应的因果关系图谱,以确定用以推荐给所述用户的待填写日志内容。2.根据权利要求1所述的订单日志处理方法,其特征在于,所述根据所述订单日志,构建与所述生成原因对应的因果关系图谱,包括:对于同一所述生成原因下的任意两个订单日志,根据所述订单日志的创建时间、所述生成原因对应的订单日志追踪时间,确定所述两个订单日志之间的时间关联度;在所述时间关联度大于阈值时间关联度的情况下,根据所述两个订单日志中的句子、同时出现在所述两个订单日志中的词语数量,确定所述两个订单日志之间的因果关联度;在所述因果关联度大于阈值因果关联度的情况下,以所述订单日志为节点,按照所述订单日志创建的先后顺序连接所述订单日志,以生成所述因果关系图谱。3.根据权利要求2所述的订单日志处理方法,其特征在于,所述在用户填写订单日志的情况下,调用与待填写订单日志的生成原因对应的因果关系图谱,以确定用以推荐给所述用户的待填写日志内容,包括:基于所述待填写订单日志对应的订单号,从所述因果关系图谱中确定出与所述订单号对应的最新创建的订单日志;根据所述订单日志与所述因果关系图谱中其他订单日志的因果关联度设定剪枝阈值;根据所述剪枝阈值,基于图谱剪枝算法,从所述因果关系图谱中确定出用以推荐给所述用户的一个或多个订单日志。4.根据权利要求1所述的订单日志处理方法,其特征在于,在根据所述订单日志,构建所述生成原因对应的因果关系图谱之前,还包括:对所述生成原因对应的订单日志进行聚类,以生成所述生成原因对应的聚类簇;确定所述聚类簇中心预设半径范围内的一个或多个订单日志为所述生成原因对应的标准日志,以根据所述标准日志,构建所述生成原因对应的因果关系图谱。5.根据权利要求4所述的订单日志处理方法,其特征在于,所述对所述生成原因对应的订单日志进行聚类,以生成所述生成原因对应的聚类簇,包括:基于TF

IDF算法及TextRank算法,从所述订单日志中提取所述订单日志对应的一个或多个关键词;对所述关键词的编码进行聚类,以生成所述聚类簇。6.根据权利要求4所述的订单日志处理方法,其特征在于,在对所述生成原因对应的订单日志进行聚类,以生成所述生成原因对应的聚类簇之前,还包括:删除所述订单日志中的下述一种或多种内容:标点符号、停用词、日期、货币符号、出现频率高于第一阈值频率的一个或多个词语、出现频率低于第二阈值频率的一个...

【专利技术属性】
技术研发人员:李薛
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1