社会经济指标的识别方法及装置制造方法及图纸

技术编号:13202202 阅读:60 留言:0更新日期:2016-05-12 10:57
本公开提供了一种社会经济指标的识别方法和装置,属于移动互联网领域。该方法包括:获取待识别的文本集合;获取待识别的社会政治实体名称;从该文本集合中获取多个第一文本;从该多个第一文本中,获取多个第一地点名称;从该多个第一文本中,获取多个第一时间;从该多个第一文本中,获取多个第一数量词;对于每个第一文本,生成该第一文本的社会经济指标项,该第一文本的社会经济指标项包括该第一文本的第一地点名称、第一时间、第一数量词及该第一文本中的社会经济指标名称。本公开的技术方案实现了对待识别文本集合的社会经济指标的自动识别,节约了人力、财力资源,同时也大大缩小了识别社会经济指标所需的时间。

【技术实现步骤摘要】

本公开涉及移动互联网领域,尤其涉及一种社会经济指标的识别方法及装置
技术介绍
社会经济指标一般包括两部分的内容,其一为社会经济指标名称,如“国内生产总值”、“货币总量”、“固定资产投资额”等,其二为社会经济指标值,如“518942.1亿”等,社会经济指标一般具有较大的分析价值,因此有必要对齐进行识别,然而,与名称、号码等传统识别对象不同的是,社会经济指标中的社会经济指标名和社会经济指标值在文本中可能并不相邻,这就导致识别的难度加大,传统的识别方式难以实现对社会经济指标的识别。由于社会经济指标的特殊性,相关技术中,一般采用人工的方式进行社会经济指标的识别和整理,然而这样的方法不仅需要耗费大量的人力、财力,同时需要耗费大量的时间,效率较低,因此,目前亟需一种可以自动识别社会经济指标的方法。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种社会经济指标的识别方法及装置。根据本公开实施例的第一方面,提供一种社会经济指标的识别方法,包括:获取待识别的文本集合,所述文本集合包括多个文本;获取待识别的社会政治实体名称;从所述文本集合中获取多个第一文本,所述第一文本包括所述社会政本文档来自技高网...

【技术保护点】
一种社会经济指标的识别方法,其特征在于,所述方法包括:获取待识别的文本集合,所述文本集合包括多个文本;获取待识别的社会政治实体名称;从所述文本集合中获取多个第一文本,所述第一文本包括所述社会政治实体名称及社会经济指标名称集合中的任一社会经济指标名称;从所述多个第一文本中,获取多个第一地点名称,每个第一地点名称为预设地点名称集合中的地点名称;从所述多个第一文本中,获取多个第一时间;从所述多个第一文本中,获取多个第一数量词;对于每个第一文本,生成所述第一文本的社会经济指标项,所述第一文本的社会经济指标项包括所述第一文本的第一地点名称、第一时间、第一数量词及所述第一文本中的社会经济指标名称。

【技术特征摘要】

【专利技术属性】
技术研发人员:汪平仄张涛龙飞
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1