数据集的构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37508622 阅读:36 留言:0更新日期:2023-05-07 09:47
本发明专利技术实施例提供了一种数据集的构建方法、装置、电子设备及存储介质,通过获取历史检索请求、与历史检索请求对应的历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息,然后获取用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比,根据身份基准分值、用户行为分值以及数量占比对历史检索对象的期望进行计算,获得历史检索对象对应的检索期望值和检索期望度,将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,检索数据集作为检索模型的训练样本,检索模型用于根据用户输入的检索请求对检索对象进行检索。索对象进行检索。索对象进行检索。

【技术实现步骤摘要】
数据集的构建方法、装置、电子设备及存储介质


[0001]本专利技术涉及模型数据处理领域,特别是涉及一种数据集的构建方法、一种数据集的构建装置、一种电子设备以及一种计算机可读存储介质。

技术介绍

[0002]在信息化时代,人们可以随时随地利用互联网获知有用的信息,例如用户可以登录检索网站,并在检索网站中输入检索内容,服务器接收到用户输入指令之后,可以反馈与输入检索内容相应的检索结果。
[0003]然而,现有的检索技术中往往采用以下两种方式获得检索结果:一种方式是提取用户输入的检索内容的关键字,对关键字进行简单地全文检索,仅按照检索结果的关键词数量的高低次序显示检索结果,导致检索的精准度低,且用户需要从大量的检索结果中逐一查看并选择匹配的检索结果,浪费了用户大量时间。另一种方式是由相关技术人员按照历史输入的关键词,模拟大量关键词,然后人为地修正与关键词管理的各个检索结果,导致检索的人力成本过高、检索效率低下。

技术实现思路

[0004]本专利技术实施例是提供一种数据集的构建方法、装置、电子设备以及计算机可读存储介质,以解决或本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据集的构建方法,其特征在于,所述方法包括:获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取实时检索请求以及所述实时检索请求对应的实时请求信息;将所述实时请求信息输入所述检索模型进行内容检索,输出大于或等于预设检索期望值和预设检索期望度的目标检索对象。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取新增对象请求以及所述新增对象请求对应的新增请求信息,所述新增请求信息包括新增检索对象和新增关键词组;将所述新增关键词组与所述历史关键词组进行数量比对,获得相应的数量比对值,并将大于或等于所述检索期望值的数量比对值与所述检索期望度相乘,输出针对所述新增检索对象的新增检索期望度。4.根据权利要求1所述的方法,其特征在于,所述将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,包括:将所述历史关键词组、所述检索期望值以及所述检索期望度进行数据关联,将所述历史关键词组和所述历史检索对象进行对象关联,构建与所述历史检索对象对应的检索数据集。5.根据权利要求1所述的方法,其特征在于,所述获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比,包括:从预设身份基准分值列表中提取多个所述用户身份属性对应的第一分值,将分值最高的第一分值作为所述身份基准分值;从预设用户行为分值列表中提取多个所述用户行为信息对应的第二分值,将分值最高的第二分值作为所述用户行为分值;通过分词工具对所述历史搜索对象...

【专利技术属性】
技术研发人员:叶小卫卢正阳吴航波叶昌斌何夏芳
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1