【技术实现步骤摘要】
信息获取方法、装置、设备以及存储介质
[0001]本公开涉及计算机
,具体涉及信息流
,尤其涉及信息获取方法
、
装置
、
设备以及存储介质
。
技术介绍
[0002]在当今快节奏的社交和工作环境中,人们越来越多地倾向于使用
IM(Instant Messaging
,即时通讯
)
进行沟通和交流
。
然而,
IM
场景下存在一个普遍的问题:信息量庞大,但知识密度相对较低
。
这给知识的沉淀和推送带来了巨大的挑战,因此需要寻找创新的解决方案
。
技术实现思路
[0003]本公开提供了一种信息获取方法
、
装置
、
设备以及存储介质,提高信息检索和获取精度,增强用户体验
。
[0004]根据本公开的第一方面,提供了一种信息获取方法,包括:
[0005]接收信息获取任务;
[0006]根据信息获取任务,从候选信息块集合中确定至少一个目标信息块;
[0007]根据信息获取任务的任务文本和至少一个目标信息块,得到拼接文本;
[0008]将拼接文本输入预设模型,得到目标信息
。
[0009]根据本公开的第二方面,提供了一种信息获取装置,包括:
[0010]接收模块,被配置为接收信息获取任务;
[0011]第一确定模块,被配置为根据信息获取任务,从候选信息块集合中确 ...
【技术保护点】
【技术特征摘要】
1.
一种信息获取方法,包括:接收信息获取任务;根据所述信息获取任务,从候选信息块集合中确定至少一个目标信息块;根据所述信息获取任务的任务文本和所述至少一个目标信息块,得到拼接文本;将所述拼接文本输入预设模型,得到目标信息
。2.
根据权利要求1所述的方法,还包括:确定所述信息获取任务的发送方的信息获取权限;根据所述信息获取权限,获取所述候选信息块集合
。3.
根据权利要求1或2所述的方法,其中,所述候选信息块集合包括至少一组会话信息对应的候选信息块,以及所述根据所述信息获取任务,从候选信息块集合中确定至少一个目标信息块,包括:确定所述任务文本的任务向量和所述候选信息块的信息向量;根据所述任务向量与所述信息向量之间的语义相似度,从所述候选信息块集合中确定至少一个目标信息块
。4.
根据权利要求3所述的方法,其中,所述根据所述任务向量与所述信息向量之间的语义相似度,从所述候选信息块集合中确定至少一个目标信息块,包括:根据所述任务向量与所述信息向量之间的余弦相似度或词移距离,确定所述任务向量与所述信息向量之间的语义相似度;从所述候选信息块集合中选取所述语义相似度最高的至少一个候选信息块,确定为目标信息块
。5.
根据权利要求1或2所述的方法,其中,所述根据所述信息获取任务的任务文本和所述至少一个目标信息块,得到拼接文本,包括:确定所述信息获取任务的补充描述信息;依次拼接所述任务文本
、
所述至少一个目标信息块和所述补充描述信息,得到拼接文本
。6.
根据权利要求1或2所述的方法,其中,所述将所述拼接文本输入预设模型,得到目标信息,包括:确定所述预设模型的许可文本长度阈值;响应于所述拼接文本的文本长度大于所述许可文本长度阈值,减少所述目标信息块的数量,并更新所述拼接文本;响应于所述拼接文本的文本长度小于或等于所述许可文本长度阈值,将所述拼接文本输入预设模型,得到目标信息
。7.
根据权利要求1或2所述的方法,其中,所述候选信息块集合包括至少一组会话信息对应的候选信息块,以及所述候选信息块集合通过如下方式得到:按照预设关联规则对所述会话信息进行预处理,得到多个初始信息块;根据相邻的初始信息块之间的语义相似度,得到候选信息块集合
。8.
根据权利要求7所述的方法,其中,所述预设关联规则包括时间关联规则和内容关联规则;以及
按照预设关联规则对所述会话信息进行预处理,得到多个初始信息块,包括:按照所述时间关联规则,对所述会话信息进行聚类,得到聚类信息集合;按照所述内容关联规则,对所述聚类信息集合进行处理,得到多个初始信息块
。9.
一种信息获取装置,包括:接收模块,被配置为接收信息获取任务;第一确定模块,被配置为根据所述信息获取任务,从候选信息块集合中确定至少一个目标信息块;拼接模块,被配置为根据所述信息获取任务的任务文本和所述至少一个目标信息块,得到拼接文本;第一获取模块,被配置为将所述拼接文本输入预设模型,得到目标信息
。10.
根据权利要求9所述的装置,还包括:第二确定模块,被配置为确定所述信息获...
【专利技术属性】
技术研发人员:张子昱,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。