基于人工智能的文本信息搜索方法及装置、设备、介质制造方法及图纸

技术编号:34049147 阅读:27 留言:0更新日期:2022-07-06 15:22
本申请公开了一种基于人工智能的文本信息搜索方法及装置、设备、介质,涉及人工智能技术领域,主要目的在于解决现有文本信息搜索准确性差的问题。包括:获取待搜索的目标词语,并从所述全局文本信息中确定与所述目标词语匹配的至少一个目标文本信息;通过所述目标词语的第一权重向量与所述目标文本信息的第二权重向量与主题词向量分别进行相乘处理,得到第一加权主题向量以及第二加权主题向量,所述主题词向量为通过已完成模型训练的搜索提取模型在所述全局文本信息中提取多个主题词得到的向量内容;基于所述第一加权主题向量与所述第二加权主题向量的相似度值确定作为搜索得到的文本信息。到的文本信息。到的文本信息。

Text information search method and device, equipment and media based on Artificial Intelligence

【技术实现步骤摘要】
基于人工智能的文本信息搜索方法及装置、设备、介质


[0001]本申请涉及一种人工智能
,特别是涉及一种基于人工智能的文本信息搜索方法及装置、设备、介质。

技术介绍

[0002]随着自然语言技术的发展,在不同应用场景中基于词语进行搜索相关信息已经逐步依赖于人工智能算法进行实现,尤其是,用户通常会通过录入文字词语等文本内容进行搜索信息,此时,执行端会通过算法模型对文字词语等进行搜索,从而搜索得到匹配的信息。
[0003]目前,现有在搜索信息过程中,算法模型会将目标搜索信息进行纠错和同义词转换,并召回修正后的搜索信息。但是,在较多的应用场景中,用户对于搜索信息的意图是具有发散性的,如,用户在搜索“牛奶”时候,除了召回与“牛奶”相关的内容外,可能存在需要搜索面包、补钙、乳糖等信息,而仅仅基于明确的搜索词语不会进行搜索范围以及搜索内容上的扩展,从而会导致搜索得到的搜索信息范围较小,无法满足用户的多样化搜索需求,从而影响搜索的准确性以及有效性。

技术实现思路

[0004]有鉴于此,本申请提供一种基于人工智能的文本信息搜索方法及本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的文本信息搜索方法,其特征在于,包括:获取待搜索的目标词语,并从所述全局文本信息中确定与所述目标词语匹配的至少一个目标文本信息;通过所述目标词语的第一权重向量与所述目标文本信息的第二权重向量与主题词向量分别进行相乘处理,得到第一加权主题向量以及第二加权主题向量,所述主题词向量为通过已完成模型训练的搜索提取模型在所述全局文本信息中提取多个主题词得到的向量内容;基于所述第一加权主题向量与所述第二加权主题向量的相似度值确定作为搜索得到的文本信息。2.根据权利要求1所述的方法,其特征在于,所述获取待搜索的目标词语,并从所述全局文本信息中确定与所述目标词语匹配的至少一个目标文本信息之前,所述方法还包括:获取全局文本信息,所述全局文本信息为一个搜索领域内的全部文本内容;基于已完成模型训练的搜索提取模型从所述全局文本信息中提取主题词,所述主题词包括多个词语;构建所述主题词的主题词向量,所述主题词向量由多个词语在所述全局文本信息中的权重值组成。3.根据权利要求2所述的方法,其特征在于,所述通过所述目标词语的第一权重向量与所述目标文本信息的第二权重向量与主题词向量分别进行相乘处理之前,所述方法还包括:基于第一词向量模型从所述全局文本信息中提取所述目标词语的第一权重向量,所述第一权重向量为所述目标词语处于所述所述全局文本信息中的分布权重;基于第二词向量模型从所述全局文本信息中提取所述目标文本信息的第二权重向量,所述第二权重向量为所述目标文本信息处于全局文本信息中的分布权重。4.根据权利要求1所述的方法,其特征在于,所述从所述全局文本信息中确定与所述目标词语匹配的目标文本信息包括:获取预设词语文本关联关系,所述预设词语文本关联关系中包含不同词语与不同文本信息之间的权重映射关系;基于所述第一权重向量的矩阵值,从所述预设词语文本关联关系中查找到与所述目标词语匹配的目标文本信息。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一加权主题向量与所述第二加权主题向量的相似度值确定作...

【专利技术属性】
技术研发人员:刘金勇
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1