【技术实现步骤摘要】
本专利技术涉及智能检索领域,尤其涉及结合知识图谱的科普内容智能检索交互系统及方法。
技术介绍
1、在数字化时代,科普知识的传播载体日益丰富,文本、图像、视频等多源异构数据构成海量科普内容库。与此同时,公众对科普知识的需求也更加多元化和个性化,传统检索方式难以满足精准、高效获取科普信息的需求。构建智能化的科普内容检索交互系统,成为推动科普知识广泛传播、提升公众科学素养的关键。
2、现有科普内容检索系统普遍存在语义理解不足的问题。多数系统依赖简单的关键词匹配技术,仅能从文本表面进行检索,无法深入挖掘科普内容中实体之间的语义关联。例如,当用户检索“人工智能的发展历史”,系统可能仅返回包含“人工智能”和“发展历史”关键词的内容,而忽略相关技术演变、关键人物贡献等语义关联信息,导致检索结果缺乏全面性和关联性。
3、此外,现有技术在用户交互体验优化方面存在明显短板。传统检索系统通常以静态方式呈现检索结果,缺乏对用户交互行为的动态分析机制。在用户检索过程中,用户浏览时长、点击偏好、二次检索关键词变化等行为数据,都蕴含着用户检索
...【技术保护点】
1.结合知识图谱的科普内容智能检索交互系统,其特征在于,包括:
2.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述知识图谱构建单元中,构建知识图谱时采用的实体抽取公式为:其中,E表示抽取得到的实体集合,σ为激活函数,n为特征数量,wi为第i个特征的权重向量,fi(D)为从多源科普数据D中提取的第i个特征,b为偏置向量;关系识别公式为:其中,R表示识别出的关系集合,为所有可能关系的集合,P(r∣e1,e2,K)为在知识图谱K中,实体e1与实体e2存在关系r的概率。
3.根据权利要求1所述的结合知识图谱的科普内容智能检
...【技术特征摘要】
1.结合知识图谱的科普内容智能检索交互系统,其特征在于,包括:
2.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述知识图谱构建单元中,构建知识图谱时采用的实体抽取公式为:其中,e表示抽取得到的实体集合,σ为激活函数,n为特征数量,wi为第i个特征的权重向量,fi(d)为从多源科普数据d中提取的第i个特征,b为偏置向量;关系识别公式为:其中,r表示识别出的关系集合,为所有可能关系的集合,p(r∣e1,e2,k)为在知识图谱k中,实体e1与实体e2存在关系r的概率。
3.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述多层多头注意力机制协同的transformer编码单元中,多头注意力计算采用公式:multihead(q,k,v)=concat(head1,…,headh)wo,其中,q为查询向量,k为键向量,v为值向量,和wo为训练的权重矩阵,h为注意力头的数量;所述transformer编码单元的输出特征向量计算公式为:h=layernorm(x+mha(x)),其中,h为输出特征向量,x为输入的词向量,mha(x)为多头注意力机制对x的计算结果,layernorm为层归一化操作。
4.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述知识图谱嵌入与transformer特征融合单元中,知识图谱嵌入向量生成公式为:g=∑(s,p,o)∈gα(s,p,o)·ψ(s,p,o),其中,g为知识图谱嵌入向量,g为知识图谱中的三元组集合,(s,p,o)表示主语、谓语、宾语构成的三元组,α(s,p,o)为三元组(s,p,o)的权重,ψ(s,p,o)为三元组(s,p,o)的向量表示;特征融合公式为:f=β1·t+β2·g,其中,f为融合后的特征向量,t为transformer编码单元输出的特征向量,β1和β2为融合权重参数。
5.根据权利要求1所述的结合知识图谱的科普内容智能检索交互系统,其特征在于,所述基于融合特征的检索结果排序单元中,余弦相似度计算采用公式:其中,sim(f,ci)表示融合特征向量f与科普内容ci的余弦相似度,ci为科普内容库中第i个科普内容的向量表示,||f||和||ci||分别为向量f和ci的范数;初始检索结果排序依据公式:rankini...
【专利技术属性】
技术研发人员:叶明明,孙向锋,
申请(专利权)人:拉萨经济技术开发区圣地星途信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。