结合知识图谱的科普内容智能检索交互系统及方法技术方案

技术编号:46561445 阅读:1 留言:0更新日期:2025-10-10 21:14
本发明专利技术公开了结合知识图谱的科普内容智能检索交互系统及方法,系统包含知识图谱构建单元、多层多头注意力机制协同的Transformer编码单元、知识图谱嵌入与Transformer特征融合单元、基于融合特征的检索结果排序单元、交互意图捕捉单元及结果优化输出单元。通过对多源科普数据构建知识图谱,运用Transformer编码提取检索关键词特征,将二者融合后计算与科普内容的相似度完成初始排序;同时实时捕捉用户交互行为分析意图变化,结合知识图谱语义关联对初始结果重新调整输出。方法对应系统各单元操作步骤,实现科普内容智能检索交互。该系统及方法有效解决传统检索语义理解不足、交互体验差等问题,提升科普内容检索的准确性与交互智能性。

【技术实现步骤摘要】

本专利技术涉及智能检索领域,尤其涉及结合知识图谱的科普内容智能检索交互系统及方法


技术介绍

1、在数字化时代,科普知识的传播载体日益丰富,文本、图像、视频等多源异构数据构成海量科普内容库。与此同时,公众对科普知识的需求也更加多元化和个性化,传统检索方式难以满足精准、高效获取科普信息的需求。构建智能化的科普内容检索交互系统,成为推动科普知识广泛传播、提升公众科学素养的关键。

2、现有科普内容检索系统普遍存在语义理解不足的问题。多数系统依赖简单的关键词匹配技术,仅能从文本表面进行检索,无法深入挖掘科普内容中实体之间的语义关联。例如,当用户检索“人工智能的发展历史”,系统可能仅返回包含“人工智能”和“发展历史”关键词的内容,而忽略相关技术演变、关键人物贡献等语义关联信息,导致检索结果缺乏全面性和关联性。

3、此外,现有技术在用户交互体验优化方面存在明显短板。传统检索系统通常以静态方式呈现检索结果,缺乏对用户交互行为的动态分析机制。在用户检索过程中,用户浏览时长、点击偏好、二次检索关键词变化等行为数据,都蕴含着用户检索意图的调整信息,但现本文档来自技高网...

【技术保护点】

1.结合知识图谱的科普内容智能检索交互系统,其特征在于,包括:

2.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述知识图谱构建单元中,构建知识图谱时采用的实体抽取公式为:其中,E表示抽取得到的实体集合,σ为激活函数,n为特征数量,wi为第i个特征的权重向量,fi(D)为从多源科普数据D中提取的第i个特征,b为偏置向量;关系识别公式为:其中,R表示识别出的关系集合,为所有可能关系的集合,P(r∣e1,e2,K)为在知识图谱K中,实体e1与实体e2存在关系r的概率。

3.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在...

【技术特征摘要】

1.结合知识图谱的科普内容智能检索交互系统,其特征在于,包括:

2.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述知识图谱构建单元中,构建知识图谱时采用的实体抽取公式为:其中,e表示抽取得到的实体集合,σ为激活函数,n为特征数量,wi为第i个特征的权重向量,fi(d)为从多源科普数据d中提取的第i个特征,b为偏置向量;关系识别公式为:其中,r表示识别出的关系集合,为所有可能关系的集合,p(r∣e1,e2,k)为在知识图谱k中,实体e1与实体e2存在关系r的概率。

3.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述多层多头注意力机制协同的transformer编码单元中,多头注意力计算采用公式:multihead(q,k,v)=concat(head1,…,headh)wo,其中,q为查询向量,k为键向量,v为值向量,和wo为训练的权重矩阵,h为注意力头的数量;所述transformer编码单元的输出特征向量计算公式为:h=layernorm(x+mha(x)),其中,h为输出特征向量,x为输入的词向量,mha(x)为多头注意力机制对x的计算结果,layernorm为层归一化操作。

4.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述知识图谱嵌入与transformer特征融合单元中,知识图谱嵌入向量生成公式为:g=∑(s,p,o)∈gα(s,p,o)·ψ(s,p,o),其中,g为知识图谱嵌入向量,g为知识图谱中的三元组集合,(s,p,o)表示主语、谓语、宾语构成的三元组,α(s,p,o)为三元组(s,p,o)的权重,ψ(s,p,o)为三元组(s,p,o)的向量表示;特征融合公式为:f=β1·t+β2·g,其中,f为融合后的特征向量,t为transformer编码单元输出的特征向量,β1和β2为融合权重参数。

5.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述基于融合特征的检索结果排序单元中,余弦相似度计算采用公式:其中,sim(f,ci)表示融合特征向量f与科普内容ci的余弦相似度,ci为科普内容库中第i个科普内容的向量表示,||f||和||ci||分别为向量f和ci的范数;初始检索结果排序依据公式:rankini...

【专利技术属性】
技术研发人员:叶明明孙向锋
申请(专利权)人:拉萨经济技术开发区圣地星途信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1