当前位置: 首页 > 专利查询>杜泽壮专利>正文

新闻文本识别的方法、装置以及存储介质制造方法及图纸

技术编号:23191346 阅读:19 留言:0更新日期:2020-01-24 16:25
本申请公开了一种新闻文本识别的方法、装置以及存储介质。其中,该方法包括:确定待识别的新闻文本包含的第一关键词;利用预先设置的对应规则,确定与第一关键词对应的标签,其中对应规则记录关键词和标签之间的映射关系;以及根据第一关键词对应的标签,对新闻文本进行识别。从而解决了人工提取关键字对新闻文本进行识别,准确率低下并且覆盖率不广的技术问题。

Method, device and storage medium of news text recognition

【技术实现步骤摘要】
新闻文本识别的方法、装置以及存储介质
本申请涉及计算机领域,特别是涉及一种新闻文本识别的方法、装置以及存储介质。
技术介绍
新闻是人们获取信息的一种渠道,通过新闻我们可以时时刻刻了解身边以及社会上的一些事情。特别是时政新闻,可以让我们了解当今社会的发展政策以及一些重要、重大的事件。众所周知的,新闻的种类以及数量是尤其庞大的,每天都会产生大量的不同新闻,这对于人们而言,从大量的新闻中获取热点新闻的是一件不容易的事情。而现有的技术方案是采用呢人工提取关键词的方式对新闻进行识别归类,但是这种方式的准确率不高,并且覆盖率也不广。针对上述的现有技术中存在的人工提取关键字对新闻文本进行识别,准确率低下并且覆盖率不广的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本公开的实施例提供了一种新闻文本识别的方法、装置以及存储介质,以至少解决现有技术中存在的人工提取关键字对新闻文本进行识别,准确率低下并且覆盖率不广的技术问题。根据本公开实施例的一个方面,提供了一种新闻文本识别的方法,包括:确定待识别的新闻文本包含的第一关键词;利用预先设置的对应规则,确定与第一关键词对应的标签,其中对应规则记录关键词和标签之间的映射关系;根据第一关键词对应的标签,对新闻文本进行识别。根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。根据本公开实施例的另一个方面,还提供了一种新闻文本识别的装置,包括:第一确定模块,用于确定待识别的新闻文本包含的第一关键词;计算模块,用于利用预先设置的对应规则,确定与第一关键词对应的标签,其中对应规则记录关键词和标签之间的映射关系;以及识别模块,用于根据第一关键词对应的标签,对新闻文本进行识别。根据本公开实施例的另一个方面,还提供了一种新闻文本识别的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:确定待识别的新闻文本包含的第一关键词;以及利用预先设置的对应规则,确定与第一关键词对应的标签,其中对应规则记录关键词和标签之间的映射关系;根据第一关键词对应的标签,对新闻文本进行识别。在本公开实施例中,首先确定新闻文本中包含的关键词(第一关键词),然后利用预先设置的对应规则,确定与第一关键词对应的标签,其中标签是从热点新闻中确定的,并且与关键词之间存在映射关系。最终根据标签对新闻文本进行识别,即确定新闻文本属于哪个热点。从而实现了有效提高新闻热点识别的工作效率、准确率的技术效果。进而解决了现有技术中存在的人工提取关键字对新闻文本进行识别,准确率低下并且覆盖率不广的技术问题。附图说明此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;图2是根据本公开实施例1的第一个方面所述的新闻文本识别的方法的流程示意图;图3是根据本公开实施例2所述的新闻文本识别的装置的示意图;以及图4是根据本公开实施例3所述的新闻文本识别的装置的示意图。具体实施方式为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本实施例,提供了一种新闻文本识别的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现新闻文本识别的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的新闻文本识别的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的新闻文本识别的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。本文档来自技高网
...

【技术保护点】
1.一种新闻文本识别的方法,其特征在于,包括:/n确定待识别的新闻文本包含的第一关键词;/n利用预先设置的对应规则,确定与所述第一关键词对应的标签,其中所述对应规则记录关键词和标签之间的映射关系;以及/n根据所述第一关键词对应的标签,对所述新闻文本进行识别。/n

【技术特征摘要】
1.一种新闻文本识别的方法,其特征在于,包括:
确定待识别的新闻文本包含的第一关键词;
利用预先设置的对应规则,确定与所述第一关键词对应的标签,其中所述对应规则记录关键词和标签之间的映射关系;以及
根据所述第一关键词对应的标签,对所述新闻文本进行识别。


2.根据权利要求1所述的方法,其特征在于,还包括根据以下步骤确定所述对应规则:
获取新闻热点信息;
确定所述新闻热点信息包含的第二关键词;以及
将所述第二关键词映射为对应的标签,确定所述对应规则。


3.根据权利要求1所述的方法,其特征在于,确定待识别的新闻文本包含的第一关键词的操作,包括:
确定新闻文本包含的多个词语,并且计算所述多个词语中的每个词语在所述新闻文本出现的次数;
根据所述次数对所述多个词语进行排序;以及
根据排序的结果,确定所述第一关键词。


4.根据权利要求1所述的方法,其特征在于,确定待识别的新闻文本包含的第一关键词的操作之前,还包括:从监控APP接收所述新闻文本。


5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至4中任意一项所述的方法。


6.一种新闻文本识别的装置,其特征在于,包括:
第一确定模块,用于确定待识别的新闻文本包含的第一关键词;
计算模块,用于利...

【专利技术属性】
技术研发人员:杜泽壮
申请(专利权)人:杜泽壮
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1