一种基于知识图谱的评估推送方法、系统、设备和介质技术方案

技术编号:29673535 阅读:9 留言:0更新日期:2021-08-13 21:55
本发明专利技术提出一种基于知识图谱的评估推送方法、系统、设备和介质,包括:获取预设时间段内目标对象的检测记录,并根据所述检测记录生成所述目标对象的知识图谱;创建负面实体库,将所述知识图谱中的实体信息与所述负面实体库中的实体信息进行比对,获取所述目标对象的负面实体集合;获取所述负面实体集合的信息熵,若所述信息熵超出设定阈值,则根据所述负面实体集合中包含的负面实体信息获取对应的推送信息;本发明专利技术可保障信息推送准确性的同时,提高数据处理效率。

【技术实现步骤摘要】
一种基于知识图谱的评估推送方法、系统、设备和介质
本专利技术涉及自然语言处理领域,尤其涉及一种基于知识图谱的评估推送方法、系统、设备和介质。
技术介绍
日常活动和交流过程中会产生大量个人相关的数据记录,针对个人数据的有效挖掘,可用于及时发现问题,给出针对性的指导,然而现有的个人数据管理较为粗糙,将大体量的数据直接汇总到个人数据库,不仅数据查找不便,对存储设备的数据存储能力也提出极大地考验。虽然,目前针对个人浏览记录等偏好信息的数据推送方法,缺乏更为精细的数据过滤,会生成大量垃圾信息,给个人生活带来诸多不便。
技术实现思路
鉴于以上现有技术存在的问题,本专利技术提出一种基于知识图谱的评估推送方法、系统、设备和介质,主要解决现有方法处理个人数据效率低且针对性不足的问题。为了实现上述目的及其他目的,本专利技术采用的技术方案如下。一种基于知识图谱的评估推送方法,包括:获取预设时间段内目标对象的检测记录,并根据所述检测记录生成所述目标对象的知识图谱;创建负面实体库,将所述知识图谱中的实体信息与所述负面实体库中的实体信息进行比对,获取所述目标对象的负面实体集合;获取所述负面实体集合的信息熵,若所述信息熵超出设定阈值,则根据所述负面实体集合中包含的负面实体信息获取对应的推送信息。可选地,创建负面实体库,包括:获取样本数据集,对所述样本数据集中的负面实体进行标注,并根据标注信息进行分词,获取关键词数据集;对所述关键词数据集进行聚类,获取多个近义词集合;创建基于负面实体的标准词库,将所述标准词库中各标准词与匹配的近义词集合进行关联存储,构建负面实体库。可选地,获取所述负面实体集合的信息熵,包括:根据所述知识图谱获取所述负面实体集合中每个负面实体的关联负面实体数量,根据所述关联负面实体数量与所述负面实体集合中负面实体总数的比值,构建所述负面实体集合的信息熵。可选地,根据所述知识图谱获取所述负面实体集合中每个负面实体的关联负面实体数量,包括:判断所述知识图谱中当前负面实体是否连接另外一个或多个负面实体,并将连接的负面实体作为当前负面实体的关联负面实体;以及,若任意两个负面实体连接一个共同的负面实体,则连接共同负面实体的两个负面实体互为关联负面实体;按以上方式获取每个负面实体的关联负面实体数量。可选地,构建所述负面实体集合的信息熵,还包括:设置负面实体库中各负面实体对应的权重,根据所述负面实体库中实体信息的权重确定所述负面实体集合中各负面实体的权重;计算所述负面实体集合中每个负面实体的熵值,再根据权重对所述负面实体集合中所有负面实体进行加权求和,得到所述负面实体集合的信息熵。可选地,根据所述负面实体集合中包含的负面实体信息获取对应的推送信息,包括:将所述负面实体集合中各负面实体按照从负面实体库中匹配的权重进行排序,选出超出权重阈值的一个或多个负面实体,并将选出的负面实体与预先建立的推送信息数据库中的数据进行匹配,获取匹配的推送信息作为输出。可选地,若选出的负面实体包含多个,则根据所述知识图谱判断选出的多个负面实体间是否相互关联,取出相互关联的负面实体构建检索式,根据构建的检索式获取对应的推送信息;根据剩余不相关联的负面实体,分别获取对应的推送信息。一种基于知识图谱的评估推送系统,包括:知识图谱构建模块,用于获取预设时间段内目标对象的检测记录,并根据所述检测记录生成所述目标对象的知识图谱;负面实体获取模块,用于创建负面实体库,将所述知识图谱中的实体信息与所述负面实体库中的实体信息进行比对,获取所述目标对象的负面实体集合;推送决策模块,用于获取所述负面实体集合的信息熵,若所述信息熵超出设定阈值,则根据所述负面实体集合中包含的负面实体信息获取对应的推送信息。一种基于知识图谱的评估推送设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行所述的基于知识图谱的评估推送方法。一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行所述的基于知识图谱的评估推送方法。如上所述,本专利技术一种基于知识图谱的评估推送方法、系统、设备和介质,具有以下有益效果。本专利技术基于特定时间段的数据生成知识图谱,简化目标对象的特征表达,便于快速了解目标对象的特定时间段的状态;负面实体库进行快速数据筛选,根据针对性的实体信息获取数据推送,提高数据处理效率和准确性;基于信息熵判断知识图谱的稳定性,进一步过滤不必要的推送信息,保证数据的准确性和有效性。附图说明图1为本专利技术一实施例中基于知识图谱的评估推送方法的流程图。图2为本专利技术一实施例中基于知识图谱的评估推送系统的模块图。图3为本专利技术一实施例中设备结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。请参阅图1,本专利技术提供一种基于知识图谱的评估推送方法,包括步骤S01-S03。在步骤S01中,获取预设时间段内目标对象的检测记录,并根据检测记录生成目标对象的知识图谱。在一实施例中,以医学病历为例,可获取预设时间段内患者的电子病历,对电子病历中的实体、关系、属性三元组进行标注,基于标注信息分别进行实体提取、实体关系提取、属性提取。预设时间段可根据实际应用需求进行设置,示例性地,可设置为最近一个月或半年等。电子病历通常为非结构化的数据,可选地,也可将电子病历转换为结构化数据以便于进行三元组信息提取,基于结构化的数据可采用D2R(DatabasetoRDF)技术将结构化数据转换为RDF数据(linkeddata),具体转换过程这里不做赘述。电子病历中实体可包括:人名、时间、疾病、症状等;而关系是实体与实体之间的关系,示例性地,“感冒的症状是流鼻涕”,其中实体分别为“感冒”和“流鼻涕”,“症状”为两实体的关系;“A年龄35岁”,则“A”为实体,“年龄”为“A”的内在属性,“35岁”为属性值。基于的三元组信息提取,可得到三元组表示:实体-关系-实体,实体-属性-属性值。计算各三元组表示之间的相似度建立实体之间的连接,形成知识图谱。具体计算和知识图谱构建过程可采用现有技术,这里不做赘述。在步骤S02中,创建负本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的评估推送方法,其特征在于,包括:/n获取预设时间段内目标对象的检测记录,并根据所述检测记录生成所述目标对象的知识图谱;/n创建负面实体库,将所述知识图谱中的实体信息与所述负面实体库中的实体信息进行比对,获取所述目标对象的负面实体集合;/n获取所述负面实体集合的信息熵,若所述信息熵超出设定阈值,则根据所述负面实体集合中包含的负面实体信息获取对应的推送信息。/n

【技术特征摘要】
1.一种基于知识图谱的评估推送方法,其特征在于,包括:
获取预设时间段内目标对象的检测记录,并根据所述检测记录生成所述目标对象的知识图谱;
创建负面实体库,将所述知识图谱中的实体信息与所述负面实体库中的实体信息进行比对,获取所述目标对象的负面实体集合;
获取所述负面实体集合的信息熵,若所述信息熵超出设定阈值,则根据所述负面实体集合中包含的负面实体信息获取对应的推送信息。


2.根据权利要求1所述的基于知识图谱的评估推送方法,其特征在于,创建负面实体库,包括:
获取样本数据集,对所述样本数据集中的负面实体进行标注,并根据标注信息进行分词,获取关键词数据集;
对所述关键词数据集进行聚类,获取多个近义词集合;
创建基于负面实体的标准词库,将所述标准词库中各标准词与匹配的近义词集合进行关联存储,构建负面实体库。


3.根据权利要求1所述的基于知识图谱的评估推送方法,其特征在于,获取所述负面实体集合的信息熵,包括:
根据所述知识图谱获取所述负面实体集合中每个负面实体的关联负面实体数量,根据所述关联负面实体数量与所述负面实体集合中负面实体总数的比值,构建所述负面实体集合的信息熵。


4.根据权利要求1所述的基于知识图谱的评估推送方法,其特征在于,根据所述知识图谱获取所述负面实体集合中每个负面实体的关联负面实体数量,包括:
判断所述知识图谱中当前负面实体是否连接另外一个或多个负面实体,并将连接的负面实体作为当前负面实体的关联负面实体;以及,
若任意两个负面实体连接一个共同的负面实体,则连接共同负面实体的两个负面实体互为关联负面实体;
按以上方式获取每个负面实体的关联负面实体数量。


5.根据权利要求3所述的基于知识图谱的评估推送方法,其特征在于,构建所述负面实体集合的信息熵,还包括:
设置负面实体库中各负面实体对应的权重,根据所述负面实体库中实体...

【专利技术属性】
技术研发人员:姚娟娟樊代明钟南山
申请(专利权)人:明品云北京数据科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1