客户特征提取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32496107 阅读:24 留言:0更新日期:2022-03-02 10:03
本申请实施例公开一种客户特征提取方法、装置、电子设备及存储介质,其中,客户特征提取方法包括:通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。该方法中由于利用了双向语言模型,使得输出的描述客户的特征更加准确。使得输出的描述客户的特征更加准确。使得输出的描述客户的特征更加准确。

【技术实现步骤摘要】
客户特征提取方法、装置、电子设备及存储介质


[0001]本申请涉及自然语言处理
,具体涉及一种客户特征提取方法、装置、电子设备及存储介质。

技术介绍

[0002]自然语言处理(NLP,Natural Language Processing)技术是一门融合了语言学、计算机科学和机器学习的前沿技术。利用NLP技术提取有特定特征的信息,尤其是在销售领域,能够提取不同客户的特征信息,使得销售人员更快速准确的根据客户的特征信息,为客户提供服务。然而,在实践中发现,现有的客户特征提取方法仍然存在准确性较低的问题。

技术实现思路

[0003]本申请实施例公开了一种客户特征提取方法、装置、电子设备及存储介质,极大提高提取客户特征的准确性。
[0004]本申请实施例公开一种客户特征提取方法,其特征在于,所述方法包括:通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。
[0005]在一个实施例中,在所述将目标服务记录文本输入到训练完成的双向语言模型之前,所述方法还包括:从待输入的目标服务记录文本中选取出第一短文本;以及,所述通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量,包括:将所述第一短文本输入至训练完成的双向语言模型;通过所述双向语言模型对所述第一短文本进行语义识别,得到第一语义向量。
[0006]在一个实施例中,从待输入的目标服务记录文本中选取出第一短文本,包括:将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,从所述目标服务记录文本中筛选出与所述关键词匹配的第一短文本。
[0007]在一个实施例中,所述将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,包括:对待输入的目标服务记录文本进行分句处理和文本清洗处理,得到多个第二短文本;将所述多个第二短文本与多个客户特征分别对应的关键词进行匹配。
[0008]在一个实施例中,所述根据所述目标服务记录文本与所述各个种子句子的相似度,确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述目标服务记录文本与第一客户特征对应的种子句子的相似度的最大值大于设置的第一阈值时,将所述第一客户特征确定为与所述目标服务记录文本对应的目标客户特征。
[0009]在一个实施例中,所述根据所述目标服务记录文本与所述各个种子句子的相似
度,确定出与所述目标服务记录文本对应的目标客户特征,包括:当第二客户特征对应的多个种子句子中,与所述目标服务记录文本的相似度大于第二阈值的种子句子的数量,大于第三阈值时,将所述第二客户特征确定为与所述目标服务记录文本对应的目标客户特征。
[0010]在一个实施例中,所述双向语言模式是利用与多个客户特征分别对应的样本短文本进行训练得到的;与每个客户特征对应的样本短文本是从样本记录文本中筛选出的,并且满足与所述客户特征相对应的专家规则;与每个客户特征对应的专家规则,是基于与每个客户特征对应的种子句子制定的。
[0011]本申请实施例公开一种模型训练方法,所述方法包括:从样本服务记录文本中选取出与多个客户特征中每个客户特征分别对应的种子句子;根据与多个客户特征对应的专家规则,从所述样本服务记录文本中筛选出满足所述专家规则的样本短文本,以得到与所述多个客户特征分别对应的样本短文本;每个客户特征对应的专家规则是基于所述客户特征对应的种子句子制定的;每次向待训练的双向语言模型输入两个样本短文本,并通过所述待训练的双向语言模型对输入的所述两个样本短文本进行语义识别,得到所述两个样本短文本分别对应的语义向量;根据所述两个样本短文本分别对应的语义向量,计算所述两个样本短文本的预测相似度;根据所述预测相似度与所述两个样本短文本对应的真实相似度计算训练损失,并根据所述训练损失对所述待训练的双向语言模型中的参数进行调整。
[0012]在一个实施例中,当所述两个样本短文本对应于同一个客户特征时,所述两个样本短文本对应的真实相似度,高于所述两个样本短文本分别对应于不同的客户特征时,所述两个样本短文本对应的真实相似度。
[0013]在一个实施例中,所述从样本记录文本中选取出与多个客户特征中每个客户特征分别对应的种子句子,包括:针对多个客户特征中的每个客户特征,将所述样本服务记录文本包括的各个词组和所述客户特征对应的人工关键词输入至词向量模型;通过所述词向量模型从各个词组中确定出到与所述人工关键词相匹配的目标关键词;从所述样本服务记录文本中选取出包含所述目标关键词的句子作为与所述客户特征对应的种子句子。
[0014]在一个实施例中,在得到与所述多个客户特征分别对应的样本短文本之后,以及在向待训练的双向语言模型输入两个样本短文本之前,所述方法还包括:对所述样本短文本执行数据增强操作;所述数据增强操作包括:同义词替换,随机插入,随机交换,及随机删除中的至少一种操作。
[0015]本申请实施例公开一种客户特征提取装置,所述装置包括:识别模块,用于通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量;以及,通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;第一确定模块,用于根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;第二确定模块,用于根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。
[0016]本申请实施例公开一种模型训练装置,所述装置包括:选取模块,用于从样本记录文本中选取出与多个客户特征中每个客户特征分别对应的种子句子;筛选模块,用于根据与多个客户特征对应的专家规则,从所述样本服务记录文本中筛选出满足所述专家规则的样本短文本,以得到与所述多个客户特征分别对应的样本短文本;每个客户特征对应的专
家规则是基于所述客户特征对应的种子句子制定的;预测模块,用于每次向待训练的双向语言模型输入两个样本短文本,并通过所述待训练的双向语言模型对输入的所述两个样本短文本进行语义识别,得到所述两个样本短文本分别对应的语义向量;以及,根据所述两个样本短文本分别对应的语义向量,计算所述两个样本短文本的预测相似度;调整模块,用于根据所述预测相似度与所述两个样本短文本对应的真实相似度计算训练损失,并根据所述训练损失对所述待训练的双向语言模型中的参数进行调整。
[0017]本申请实施例公开一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客户特征提取方法,其特征在于,所述方法包括:通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。2.根据权利要求1所述方法,其特征在于,在所述通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量之前,所述方法还包括:从待输入的目标服务记录文本中选取出第一短文本;以及,所述通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量,包括:将所述第一短文本输入至训练完成的双向语言模型;通过所述双向语言模型对所述第一短文本进行语义识别,得到第一语义向量。3.根据权利要求2所述方法,其特征在于,从待输入的目标服务记录文本中选取出第一短文本,包括:将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,从所述目标服务记录文本中筛选出与所述关键词匹配的第一短文本。4.根据权利要求3所述方法,其特征在于,所述将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,包括:对待输入的目标服务记录文本进行分句处理和文本清洗处理,得到多个第二短文本;将所述多个第二短文本与多个客户特征分别对应的关键词进行匹配。5.根据权利要求1所述方法,其特征在于,所述多个客户特征包括:第一客户特征;以及,所述根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述目标服务记录文本与所述第一客户特征对应的种子句子的相似度的最大值大于设置的第一阈值时,将所述第一客户特征确定为与所述目标服务记录文本对应的目标客户特征。6.根据权利要求1所述方法,其特征在于,所述多个客户特征包括:第二客户特征;以及,所述根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述第二客户特征对应的多个种子句子中,与所述目标服务记录文本的相似度大于第二阈值的种子句子的数量,大于第三阈值时,将所述第二客户特征确定为与所述目标服务记录文本对应的目标客户特征。7.根据权利要求1

6任一项所述的方法,其特征在于,所述双向语言模式是利用与所述多个客户特征分别对应的样本短文本进行训练得到的;与每个客户特征对应的样本短文本是从样本记录文本中筛选出的,并且满足与所述客户特征相对应的专家规则;与每个客户
特征对应的专家规则,是基于与每个客户特征对应的种子句子制定的。8.一种模型训练方法,其特征在于,所述方法包括:从样本服务记录文本中选取出与多个客户特征中每个客户特征分别对应的种子句子;根据与多个客户特征对应的专家规则,从所述样本服务记录文本中筛选出满足所述专家规则的样本短文本,以得到与所述多个客户特征分别对应的样本短文本;每个客户特征对应的专家规则是基于所述客户特征对应的种子句子制定的;每次向待训练的双向语言模型输入两个样本短文本,并通过所述待训练的双向语言模型对输入的所述两个样本短文本进行语义识别...

【专利技术属性】
技术研发人员:梁成扬
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1