【技术实现步骤摘要】
用于输出信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于输出信息的方法和装置。
技术介绍
随着大数据技术的日益发展,越来越多的企业需要通过各种数据进行分析以挖掘其中的重要价值。然而,半结构或者非结构的数据却无法直接进行分析导致不能得到充分的利用。因此数据结构化技术对于数据挖掘来说就显得十分重要。而利用信息提取技术从半结构或非结构的数据中提取实体和实体间的关系是数据结构化技术的重要手段之一。随着人工智能技术的大力发展,机器学习方法在提取实体和实体间的关系上有广泛的应用。通常,需要人工大量标注数据(将数据中的实体和实体间的关系标注出来),并利用这些标注数据训练模型。训练出的模型能够从半结构或非结构的数据中提取出结构化的数据,即实体和实体间的关系。
技术实现思路
本申请实施例提出了用于输出信息的方法和装置。第一方面,本申请实施例提供了一种用于输出信息的方法,包括:获取待识别数据;对待识别数据进行实体识别,确定待识别数据中的实体集合;对实体集合中的至少两个实体进行关系识别,确定至少两 ...
【技术保护点】
1.一种用于输出信息的方法,包括:/n获取待识别数据;/n对所述待识别数据进行实体识别,确定所述待识别数据中的实体集合;/n对所述实体集合中的至少两个实体进行关系识别,确定所述至少两个实体间的关系;/n将所述至少两个实体和所述至少两个实体间的关系对应输出。/n
【技术特征摘要】
1.一种用于输出信息的方法,包括:
获取待识别数据;
对所述待识别数据进行实体识别,确定所述待识别数据中的实体集合;
对所述实体集合中的至少两个实体进行关系识别,确定所述至少两个实体间的关系;
将所述至少两个实体和所述至少两个实体间的关系对应输出。
2.根据权利要求1所述的方法,其中,所述对所述待识别数据进行实体识别,确定所述待识别数据中的实体集合,包括:
利用自然语言处理词法分析技术对所述待识别数据进行分词,得到所述待识别数据中的实体集合。
3.根据权利要求1所述的方法,其中,所述对所述实体集合中的至少两个实体进行关系识别,确定所述至少两个实体间的关系,包括:
基于预先配置的关系模板对所述实体集合进行关系匹配,确定所述实体集合中的至少两个实体间的关系,其中,所述关系模板包括实体的类别和槽位,以及实体间的关系词和关系词的槽位。
4.根据权利要求3所述的方法,其中,所述关系模板通过如下步骤进行配置:
配置实体的类别和关系词的词性;
配置实体的槽位和关系词的槽位;
配置关系词;
配置所述关系词对应的实体间的关系。
5.根据权利要求4所述的方法,其中,所述基于预先配置的关系模板对所述实体集合进行关系匹配,确定所述实体集合中的至少两个实体间的关系,包括:
根据所述关系模板中的实体的类别和实体的槽位对所述实体集合进行匹配,确定匹配成功的实体;
根据所述关系模板中的关系词和关系词的槽位对所述待识别数据进行匹配,若匹配成功,将所述关系模板中的匹配成功的关系词对应的实体间的关系作为所述匹配成功的实体间的关系。
6.一种用于输出信息的装置,包括:
获取单元,被配置成获取待识别数据;
实体识别单元,被配置成对所述待识别数据进行实体识别,确...
【专利技术属性】
技术研发人员:刘畅,张阳,谢奕,杨双全,郑灿祥,季昆鹏,张雪婷,熊云,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。