System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于排序模型的信息匹配方法、装置、电子设备及介质制造方法及图纸_技高网

基于排序模型的信息匹配方法、装置、电子设备及介质制造方法及图纸

技术编号:40083678 阅读:10 留言:0更新日期:2024-01-23 15:07
本申请实施例提供了基于排序模型的信息匹配方法、装置、电子设备及介质,属于金融科技技术领域。该方法包括:获取用户的画像特征、多个保险查询语句以及多个待匹配语句;对画像特征进行特征编码,得到离散特征向量;将离散特征向量、保险查询语句以及待匹配语句输入排序模型的第一模块进行计算,以确定多个候选匹配语句;计算保险查询语句与多个候选匹配语句的点击分值,得到第一分值和第二分值;将第一分值和第二分值输入排序模型的第二模块进行分值映射,输出目标分值;对多个候选匹配语句进行排序,得到排序结果。本申请实施例能够解决当同时存在多个待查询句与查询问题文本相似度相同的情况导致的排序误差的问题,提高信息的匹配准确度。

【技术实现步骤摘要】

本申请涉及金融科技,尤其涉及一种基于排序模型的信息匹配方法、装置、电子设备及介质


技术介绍

1、随着电商领域的发展,现有的推荐程序可以越来越贴切地根据用户的行为向其推荐有可能会感兴趣的商品对象,以改善用户的使用体验。并且推荐程序也被应用在众多领域,例如,金融领域、保险领域、物流运输领域等等。以金融领域为例,排序是搜索流程中最重要的问题之一,是最终直接面向用户的环节,排序结果的好坏很大程度上影响用户体验和商业转化。传统的排序算法通常被定义为文本匹配算法,即,通过计算查询问题和待查询句的相关性,根据文本相似度进行排序。

2、然而传统的基于文本相似度的排序算法通常都需要大量的标注数据,这将会大大增加人力成本。除此之外,仅仅基于文本相似度进行排序跟用户实际点击会存在稍许误差,特别是当有多个待查询问和查询问题相似度一样时,无法按照用户实际需要的内容排序。


技术实现思路

1、本申请实施例的主要目的在于提出一种基于排序模型的信息匹配方法、装置、电子设备及介质,能够解决当同时存在多个待查询句与查询问题文本相似度相同的情况导致的排序误差的问题,提高信息的匹配准确度。

2、为实现上述目的,本申请实施例的第一方面提出了一种基于排序模型的信息匹配方法,所述排序模型包括第一模块和第二模块,所述方法包括:

3、获取用户的画像特征、多个保险查询语句以及多个待匹配语句;

4、对所述画像特征进行特征编码,得到离散特征向量;

5、将所述离散特征向量、所述保险查询语句以及所述待匹配语句输入所述排序模型的第一模块进行计算,以在所述待匹配语句中确定与所述保险查询语句对应的多个候选匹配语句;

6、计算所述保险查询语句与多个所述候选匹配语句的点击分值,得到第一分值和第二分值;

7、将所述第一分值和所述第二分值输入所述排序模型的第二模块进行分值映射,输出目标分值;

8、根据所述目标分值对多个所述候选匹配语句进行排序,得到排序结果。

9、在一些实施例,所述保险查询语句包括至少一个保险问题,所述第一模块包括局部推理层和推理组合层;所述将所述离散特征向量、所述保险查询语句以及所述待匹配语句输入所述排序模型的第一模块进行计算,以在所述待匹配语句中确定与所述保险查询语句对应的多个候选匹配语句,包括:

10、对于每一个所述保险查询语句,对所述保险查询语句中的所有保险问题进行点击率统计,生成样本训练集;

11、将所述样本训练集输入所述第一模块中的局部推理层进行特征提取,得到与所述样本训练集对应的语义特征信息;

12、基于所述推理组合层对所述语义特征信息以及所述离散特征向量进行特征拼接,得到拼接信息;

13、对所述拼接信息进行特征分类,得到分类结果;

14、根据所述分类结果在所述待匹配语句中确定与所述保险查询语句对应的多个候选匹配语句。

15、在一些实施例,所述对所述保险查询语句中的所有保险问题进行点击率统计,生成样本训练集,包括:

16、对所述保险查询语句中的所有保险问题进行点击率统计,得到正样本信息和负样本信息,其中,所述正样本信息的点击率大于所述负样本信息的点击率;

17、对于每一个所述保险问题,将所述保险问题、所述正样本信息、所述负样本信息以及预设的训练标签进行绑定,生成训练数据;

18、对所有所述训练数据进行统计,得到样本训练集。

19、在一些实施例,所述候选匹配语句包括第一候选语句和第二候选语句,所述第一候选语句与所述正样本信息对应,所述第二候选语句与所述负样本信息对应;所述计算所述保险查询语句与多个所述候选匹配语句的点击分值,得到第一分值和第二分值,包括:

20、计算所述保险问题与所述第一候选语句之间的点击分值,得到第一分值,并计算所述保险问题与所述第二候选语句之间的点击分值,得到第二分值。

21、在一些实施例,所述第二模块包括激活函数层;所述将所述第一分值和所述第二分值输入所述排序模型的第二模块进行分值映射,输出目标分值,包括:

22、对所述第一分值和所述第二分值进行相减,得到目标差值;

23、将所述目标差值输入所述第二模块的激活函数层进行概率映射,输出映射分值;

24、将所述映射分值与预设的目标分值进行对比;

25、当所述映射分值大于等于所述目标分值,根据所述映射分值生成目标分值。

26、在一些实施例,所述对所述画像特征进行特征编码,得到离散特征向量,包括:

27、对所述画像特征进行离散特征数量化,得到多条离散特征数据;

28、对所有所述离散特征数据进行归一化操作,得到离散特征向量。

29、在一些实施例,所述将所述样本训练集输入所述第一模块中的局部推理层进行特征提取,得到与所述样本训练集对应的语义特征信息,包括:

30、基于预设的分词工具对所述样本训练集进行分词处理,得到多个样本词组以及文本序列;

31、将所有所述样本词组输入所述局部推理层进行单词映射,得到词嵌入表示信息;

32、对所述文本序列进行长度调节,得到序列特征;

33、对所述词嵌入表示信息以及所述序列特征进行平均池化,得到与所述样本训练集对应的语义特征信息。

34、为实现上述目的,本申请实施例的第二方面提出了一种基于排序模型的信息匹配装置,所述排序模型包括第一模块和第二模块,所述装置包括:

35、语句获取模块,用于获取用户的画像特征、多个保险查询语句以及多个待匹配语句;

36、特征编码模块,用于对所述画像特征进行特征编码,得到离散特征向量;

37、候选语句计算模块,用于将所述离散特征向量、所述保险查询语句以及所述待匹配语句输入所述排序模型的第一模块进行计算,以在所述待匹配语句中确定与所述保险查询语句对应的多个候选匹配语句;

38、分值计算模块,用于计算所述保险查询语句与多个所述候选匹配语句的点击分值,得到第一分值和第二分值;

39、分值映射模块,用于将所述第一分值和所述第二分值输入所述排序模型的第二模块进行分值映射,输出目标分值;

40、语句排序模块,用于根据所述目标分值对多个所述候选匹配语句进行排序,得到排序结果。

41、为实现上述目的,本申请实施例的第三方面提出了一种电子设备,一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于排序模型的信息匹配方法。

42、为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于排序模型的信息匹配方法。

43、本申请提出的基于排序模型的信息匹配方法、装置、电子设备及存储本文档来自技高网...

【技术保护点】

1.一种基于排序模型的信息匹配方法,其特征在于,所述排序模型包括第一模块和第二模块,所述方法包括:

2.根据权利要求1所述的基于排序模型的信息匹配方法,其特征在于,所述保险查询语句包括至少一个保险问题,所述第一模块包括局部推理层和推理组合层;所述将所述离散特征向量、所述保险查询语句以及所述待匹配语句输入所述排序模型的第一模块进行计算,以在所述待匹配语句中确定与所述保险查询语句对应的多个候选匹配语句,包括:

3.根据权利要求2所述的基于排序模型的信息匹配方法,其特征在于,所述对所述保险查询语句中的所有保险问题进行点击率统计,生成样本训练集,包括:

4.根据权利要求3所述的基于排序模型的信息匹配方法,其特征在于,所述候选匹配语句包括第一候选语句和第二候选语句,所述第一候选语句与所述正样本信息对应,所述第二候选语句与所述负样本信息对应;所述计算所述保险查询语句与多个所述候选匹配语句的点击分值,得到第一分值和第二分值,包括:

5.根据权利要求1所述的基于排序模型的信息匹配方法,其特征在于,所述第二模块包括激活函数层;所述将所述第一分值和所述第二分值输入所述排序模型的第二模块进行分值映射,输出目标分值,包括:

6.根据权利要求1所述的基于排序模型的信息匹配方法,其特征在于,所述对所述画像特征进行特征编码,得到离散特征向量,包括:

7.根据权利要求2所述的基于排序模型的信息匹配方法,其特征在于,所述将所述样本训练集输入所述第一模块中的局部推理层进行特征提取,得到与所述样本训练集对应的语义特征信息,包括:

8.一种基于排序模型的信息匹配装置,其特征在于,所述排序模型包括第一模块和第二模块,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的基于排序模型的信息匹配方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于排序模型的信息匹配方法。

...

【技术特征摘要】

1.一种基于排序模型的信息匹配方法,其特征在于,所述排序模型包括第一模块和第二模块,所述方法包括:

2.根据权利要求1所述的基于排序模型的信息匹配方法,其特征在于,所述保险查询语句包括至少一个保险问题,所述第一模块包括局部推理层和推理组合层;所述将所述离散特征向量、所述保险查询语句以及所述待匹配语句输入所述排序模型的第一模块进行计算,以在所述待匹配语句中确定与所述保险查询语句对应的多个候选匹配语句,包括:

3.根据权利要求2所述的基于排序模型的信息匹配方法,其特征在于,所述对所述保险查询语句中的所有保险问题进行点击率统计,生成样本训练集,包括:

4.根据权利要求3所述的基于排序模型的信息匹配方法,其特征在于,所述候选匹配语句包括第一候选语句和第二候选语句,所述第一候选语句与所述正样本信息对应,所述第二候选语句与所述负样本信息对应;所述计算所述保险查询语句与多个所述候选匹配语句的点击分值,得到第一分值和第二分值,包括:

5.根据权利要求1所述的基于排序模型的信息匹配方法,其特征...

【专利技术属性】
技术研发人员:金美芝周梦原
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1