用于输出信息的方法和装置制造方法及图纸

技术编号:24331178 阅读:25 留言:0更新日期:2020-05-29 19:39
本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括获取待识别数据;对待识别数据进行实体识别,确定待识别数据中的实体集合;对实体集合中的至少两个实体进行关系识别,确定至少两个实体间的关系;将至少两个实体和至少两个实体间的关系对应输出。该实施方式降低了数据结构化的人力成本。

Methods and devices for outputting information

【技术实现步骤摘要】
用于输出信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于输出信息的方法和装置。
技术介绍
随着大数据技术的日益发展,越来越多的企业需要通过各种数据进行分析以挖掘其中的重要价值。然而,半结构或者非结构的数据却无法直接进行分析导致不能得到充分的利用。因此数据结构化技术对于数据挖掘来说就显得十分重要。而利用信息提取技术从半结构或非结构的数据中提取实体和实体间的关系是数据结构化技术的重要手段之一。随着人工智能技术的大力发展,机器学习方法在提取实体和实体间的关系上有广泛的应用。通常,需要人工大量标注数据(将数据中的实体和实体间的关系标注出来),并利用这些标注数据训练模型。训练出的模型能够从半结构或非结构的数据中提取出结构化的数据,即实体和实体间的关系。
技术实现思路
本申请实施例提出了用于输出信息的方法和装置。第一方面,本申请实施例提供了一种用于输出信息的方法,包括:获取待识别数据;对待识别数据进行实体识别,确定待识别数据中的实体集合;对实体集合中的至少两个实体进行关系识别,确定至少两个实体间的关系;将至少两个实体和至少两个实体间的关系对应输出。在一些实施例中,对待识别数据进行实体识别,确定待识别数据中的实体集合,包括:利用自然语言处理词法分析技术对待识别数据进行分词,得到待识别数据中的实体集合。在一些实施例中,对实体集合中的至少两个实体进行关系识别,确定至少两个实体间的关系,包括:基于预先配置的关系模板对实体集合进行关系匹配,确定实体集合中的至少两个实体间的关系,其中,关系模板包括实体的类别和槽位,以及实体间的关系词和关系词的槽位。在一些实施例中,关系模板通过如下步骤进行配置:配置实体的类别和关系词的词性;配置实体的槽位和关系词的槽位;配置关系词;配置关系词对应的实体间的关系。在一些实施例中,基于预先配置的关系模板对实体集合进行关系匹配,确定实体集合中的至少两个实体间的关系,包括:根据关系模板中的实体的类别和实体的槽位对实体集合进行匹配,确定匹配成功的实体;根据关系模板中的关系词和关系词的槽位对待识别数据进行匹配,若匹配成功,将关系模板中的匹配成功的关系词对应的实体间的关系作为匹配成功的实体间的关系。第二方面,本申请实施例提供了一种用于输出信息的装置,包括:获取单元,被配置成获取待识别数据;实体识别单元,被配置成对待识别数据进行实体识别,确定待识别数据中的实体集合;关系识别单元,被配置成对实体集合中的至少两个实体进行关系识别,确定至少两个实体间的关系;输出单元,被配置成将至少两个实体和至少两个实体间的关系对应输出。在一些实施例中,实体识别单元进一步被配置成:利用自然语言处理词法分析技术对待识别数据进行分词,得到待识别数据中的实体集合。在一些实施例中,关系识别单元进一步被配置成:基于预先配置的关系模板对实体集合进行关系匹配,确定实体集合中的至少两个实体间的关系,其中,关系模板包括实体的类别和槽位,以及实体间的关系词和关系词的槽位。在一些实施例中,关系模板通过如下步骤进行配置:配置实体的类别和关系词的词性;配置实体的槽位和关系词的槽位;配置关系词;配置关系词对应的实体间的关系。在一些实施例中,关系识别单元进一步被配置成:根据关系模板中的实体的类别和实体的槽位对实体集合进行匹配,确定匹配成功的实体;根据关系模板中的关系词和关系词的槽位对待识别数据进行匹配,若匹配成功,将关系模板中的匹配成功的关系词对应的实体间的关系作为匹配成功的实体间的关系。第三方面,本申请实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于输出信息的方法和装置,首先对获取到的待识别数据进行实体识别,以确定待识别数据中的实体集合;然后对实体集合中的至少两个实体进行关系识别,以确定至少两个实体间的关系;最后将至少两个实体和至少两个实体间的关系对应输出。无需人工大量标注数据训练提取结构化数据的模型,通过实体识别和关系识别从非结构或半结构的数据中提取结构化的数据,降低了数据结构化的人力成本。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构;图2是根据本申请的用于输出信息的方法的一个实施例的流程图;图3A是图2所提供的用于输出信息的方法的一个应用场景的示意图;图3B是图2所提供的用于输出信息的方法的又一个应用场景的示意图;图4是根据本申请的用于输出信息的方法的又一个实施例的流程图;图5是根据本申请的用于输出信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于输出信息的方法或用于输出信息的装置的实施例的示例性系统架构100。如图1所示,系统架构100中可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101可以通过网络102与服务器103交互,以接收或发送消息等。终端设备101可以是硬件,也可以是软件。当终端设备101为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。服务器103可以提供各种服务,例如服务器103可以对从终端设备101获取到的待识别数据等数据进行分析等处理,并将处理结果(例如至少两个实体和至少两个实体间的关系)反馈给终端设备101。需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的用于输出信息的方法一般由服务器103执行本文档来自技高网...

【技术保护点】
1.一种用于输出信息的方法,包括:/n获取待识别数据;/n对所述待识别数据进行实体识别,确定所述待识别数据中的实体集合;/n对所述实体集合中的至少两个实体进行关系识别,确定所述至少两个实体间的关系;/n将所述至少两个实体和所述至少两个实体间的关系对应输出。/n

【技术特征摘要】
1.一种用于输出信息的方法,包括:
获取待识别数据;
对所述待识别数据进行实体识别,确定所述待识别数据中的实体集合;
对所述实体集合中的至少两个实体进行关系识别,确定所述至少两个实体间的关系;
将所述至少两个实体和所述至少两个实体间的关系对应输出。


2.根据权利要求1所述的方法,其中,所述对所述待识别数据进行实体识别,确定所述待识别数据中的实体集合,包括:
利用自然语言处理词法分析技术对所述待识别数据进行分词,得到所述待识别数据中的实体集合。


3.根据权利要求1所述的方法,其中,所述对所述实体集合中的至少两个实体进行关系识别,确定所述至少两个实体间的关系,包括:
基于预先配置的关系模板对所述实体集合进行关系匹配,确定所述实体集合中的至少两个实体间的关系,其中,所述关系模板包括实体的类别和槽位,以及实体间的关系词和关系词的槽位。


4.根据权利要求3所述的方法,其中,所述关系模板通过如下步骤进行配置:
配置实体的类别和关系词的词性;
配置实体的槽位和关系词的槽位;
配置关系词;
配置所述关系词对应的实体间的关系。


5.根据权利要求4所述的方法,其中,所述基于预先配置的关系模板对所述实体集合进行关系匹配,确定所述实体集合中的至少两个实体间的关系,包括:
根据所述关系模板中的实体的类别和实体的槽位对所述实体集合进行匹配,确定匹配成功的实体;
根据所述关系模板中的关系词和关系词的槽位对所述待识别数据进行匹配,若匹配成功,将所述关系模板中的匹配成功的关系词对应的实体间的关系作为所述匹配成功的实体间的关系。


6.一种用于输出信息的装置,包括:
获取单元,被配置成获取待识别数据;
实体识别单元,被配置成对所述待识别数据进行实体识别,确...

【专利技术属性】
技术研发人员:刘畅张阳谢奕杨双全郑灿祥季昆鹏张雪婷熊云
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1