一种行业知识图谱构建方法、计算机设备及存储介质技术

技术编号:40945255 阅读:18 留言:0更新日期:2024-04-18 15:03
本发明专利技术提供一种行业知识图谱构建方法、计算机设备及存储介质,基于感兴趣文本段落中的目标命名实体属性的实体文本语义表征数组构建显著性优化数组,基于显著性优化数组对字符分布表征数组进行优化,让最后基于字符分布表征数组预测获得的感兴趣文本段落中的文本字符针对目标命名实体属性的预估文本段落更准确可靠,那么最后在预估文本段落集合中确定的对于针对目标命名实体属性的目标文本段落准确可靠。

【技术实现步骤摘要】

本公开涉及文本数据处理领域,并且更具体地,涉及一种行业知识图谱构建方法、计算机设备及存储介质


技术介绍

1、知识图谱是一种基于概念图谱、本体论和语义网络的语义模型,具有根据知识组织、知识呈现、知识推理和知识应用等功能。知识图谱的应用情况非常广泛。首先,它可以应用于智能问答领域。通过建立领域内的知识图谱,智能问答系统能够更好地理解用户的提问,并给出更准确的答案。其次,知识图谱还可以应用于信息检索和推荐领域。通过将信息进行语义化表示,可以更好地理解用户的需求,从而给出更加精准的结果或推荐。此外,知识图谱还可以应用于自然语言处理、机器翻译、智能客服、人工智能等多个领域。构建行业知识图谱能够帮助行业信息沉淀,提高信息利用率。

2、行业知识图谱的构建是一个非常复杂和艰巨的任务。首先,需要对领域内的知识进行深入挖掘和理解。这包括了从结构化和非结构化数据中抽取实体、关系和属性等信息,以及对知识进行组织和分类等方面。其次,需要对知识进行语义化表示。这涉及到本体论、语义网络等方面的技术,并需要考虑如何将不同领域的知识进行统一表示。最后,需要对知识进行存储、查询本文档来自技高网...

【技术保护点】

1.一种行业知识图谱构建方法,其特征在于,应用于计算机设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述字符分布表征数组包括句字符分布表征数组和段字符分布表征数组,所述字符分布表征单元包括所述文本字符对于对应的目标命名实体属性的句边际间隔单元和段边际间隔单元,所述句字符分布表征数组中的字符分布表征单元为所述句边际间隔单元,所述段字符分布表征数组中的字符分布表征单元为所述段边际间隔单元,所述显著性优化数组包括句显著性优化数组和段显著性优化数组,所述句显著性优化数组用于修正所述句字符分布表征数组中的句边际间隔单元,所述段显著性优化数组用于修正所述段字符分布表征数...

【技术特征摘要】

1.一种行业知识图谱构建方法,其特征在于,应用于计算机设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述字符分布表征数组包括句字符分布表征数组和段字符分布表征数组,所述字符分布表征单元包括所述文本字符对于对应的目标命名实体属性的句边际间隔单元和段边际间隔单元,所述句字符分布表征数组中的字符分布表征单元为所述句边际间隔单元,所述段字符分布表征数组中的字符分布表征单元为所述段边际间隔单元,所述显著性优化数组包括句显著性优化数组和段显著性优化数组,所述句显著性优化数组用于修正所述句字符分布表征数组中的句边际间隔单元,所述段显著性优化数组用于修正所述段字符分布表征数组中的段边际间隔单元;

3.根据权利要求2所述的方法,其特征在于,所述通过所述优化后的句字符分布表征数组和所述优化后的段字符分布表征数组,确定所述文本字符对应的预估文本段落,包括:

4.根据权利要求1所述的方法,其特征在于,所述在所述预估文本段落集合中确定与所述目标命名实体属性在所述目标行业知识文本中的命名实体属性分布位置和命名实体属性文本长度对应的预...

【专利技术属性】
技术研发人员:吕国伟张丽晓王磊李洪洋李东冬
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1