当前位置: 首页 > 专利查询>韩伟专利>正文

中文关键字提取系统技术方案

技术编号:6819212 阅读:244 留言:0更新日期:2012-04-11 18:40
本实用新型专利技术涉及电子技术领域,尤其是涉及一种中文关键字提取系统。它解决了现有技术设计不够合理等技术问题。本系统包括中央处理器,在中央处理器上连接有用于存储中文词语语义且能在中央处理器控制下更新存储数据的智能中文词语语义存储器,在中央处理器上连接有能够输入目标文本信息的文本信息收集器,所述的中央处理器上还连接有神经元网络拓扑联想处理器,在神经元网络拓扑联想处理器上设有中文关键字输出端口。与现有的技术相比,本中文关键字提取系统的优点在于:设计合理,结构简单,工作效率高,提取效果好,并且能够根据工作过程实时更新数据,进一步提高提取效率。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

中文关键字提取系统技术领 域本技术涉及电子
,尤其是涉及一种中文关键字提取系统。
技术介绍
提取关键字在文献处理领域具有重要的作用,能够有效优化文献检索、便于对文献进行归纳和分类。为了提高关键字提取的准确性和合理性,人们进行了长期的探索,提出了各种各样的解决方案。例如,中国专利文献公开了一种关键字存储、查找方法和设备,所述方法包括将关键字分为多个字段;取第一字段对应的随机数;对常数进行移位运算,移位的结果与所述随机数进行异或运算,得到第一字段对应的哈希值;从第二字段开始,取当前字段对应的随机数;对当前字段的前一字段对应的哈希值进行移位运算,移位的结果与所述当前字段的随机数进行异或运算,得到当前字段对应的哈希值;将所述关键字存储到地址为最后字段对应的哈希值的存储区;以及应用上述方法到相应的存储区查找关键字。所述设备包括分割模块、第一哈希值获取模块、多级哈希值获取模块和存储模块。本专利技术中最终哈希值的分布与理论上的随机分布非常接近,提高了查找的准确度。上述方案在一定程度上提高了关键字的提取效果,但是仍然存在着设计不够合理,设备成本较高,数据处理时间较长,无法根据使用状况对提取过程进行优化等技术问题。
技术实现思路
本技术的目的是针对上述问题,提供一种设计合理,结构简单,易于操作,工作效率高的中文关键字提取系统。为达到上述目的,本技术采用了下列技术方案本中文关键字提取系统,其特征在于,本系统包括中央处理器,在中央处理器上连接有用于存储中文词语语义且能在中央处理器控制下更新存储数据的智能中文词语语义存储器,在中央处理器上连接有能够输入目标文本信息的文本信息收集器,所述的中央处理器上还连接有神经元网络拓扑联想处理器,在神经元网络拓扑联想处理器上设有中文关键字输出端口。在上述的中文关键字提取系统中,所述的神经元网络拓扑联想处理器上连接有用于统计词频的计数器。在上述的中文关键字提取系统中,所述的中央处理器上还连接有显示装置和网络通讯装置。与现有的技术相比,本中文关键字提取系统的优点在于设计合理,结构简单,工作效率高,提取效果好,并且能够根据工作过程实时更新数据,进一步提高提取效率。附图说明图1是本技术提供的结构框图。图中,中央处理器1、智能中文词语语义存储器2、文本信息收集器3、神经元网络拓扑联想处理器4、中文关键字输出端口 5、计数器6、显示装置7、网络通讯装置8。具体实施方 式如图1所示,本中文关键字提取系统包括中央处理器1,在中央处理器1上连接有用于存储中文词语语义且能在中央处理器1控制下更新存储数据的智能中文词语语义存储器2,在中央处理器1上连接有能够输入目标文本信息的文本信息收集器3,所述的中央处理器1上还连接有神经元网络拓扑联想处理器4,在神经元网络拓扑联想处理器4上设有中文关键字输出端口 5。神经元网络拓扑联想处理器4上连接有用于统计词频的计数器6。 中央处理器1上还连接有显示装置7和网络通讯装置8。本文中所描述的具体实施例仅仅是对本技术精神作举例说明。本技术所属
的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本技术的精神或者超越所附权利要求书所定义的范围。尽管本文较多地使用了中央处理器1、智能中文词语语义存储器2、文本信息收集器3、神经元网络拓扑联想处理器4、中文关键字输出端口 5、计数器6、显示装置7、网络通讯装置8等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本技术的本质;把它们解释成任何一种附加的限制都是与本技术精神相违背的。权利要求1.一种中文关键字提取系统,其特征在于,本系统包括中央处理器(1),在中央处理器 (1)上连接有用于存储中文词语语义且能在中央处理器(1)控制下更新存储数据的智能中文词语语义存储器(2),在中央处理器(1)上连接有能够输入目标文本信息的文本信息收集器(3),所述的中央处理器(1)上还连接有神经元网络拓扑联想处理器(4),在神经元网络拓扑联想处理器(4)上设有中文关键字输出端口(5)。2.根据权利要求1所述的中文关键字提取系统,其特征在于,所述的神经元网络拓扑联想处理器(4)上连接有用于统计词频的计数器(6)。3.根据权利要求1或2所述的中文关键字提取系统,其特征在于,所述的中央处理器 (1)上还连接有显示装置(7)和网络通讯装置(8)。专利摘要本技术涉及电子
,尤其是涉及一种中文关键字提取系统。它解决了现有技术设计不够合理等技术问题。本系统包括中央处理器,在中央处理器上连接有用于存储中文词语语义且能在中央处理器控制下更新存储数据的智能中文词语语义存储器,在中央处理器上连接有能够输入目标文本信息的文本信息收集器,所述的中央处理器上还连接有神经元网络拓扑联想处理器,在神经元网络拓扑联想处理器上设有中文关键字输出端口。与现有的技术相比,本中文关键字提取系统的优点在于设计合理,结构简单,工作效率高,提取效果好,并且能够根据工作过程实时更新数据,进一步提高提取效率。文档编号G06F17/30GK202025316SQ201120085840公开日2011年11月2日 申请日期2011年3月28日 优先权日2011年3月28日专利技术者韩伟 申请人:韩伟本文档来自技高网
...

【技术保护点】
1.一种中文关键字提取系统,其特征在于,本系统包括中央处理器(1),在中央处理器(1)上连接有用于存储中文词语语义且能在中央处理器(1)控制下更新存储数据的智能中文词语语义存储器(2),在中央处理器(1)上连接有能够输入目标文本信息的文本信息收集器(3),所述的中央处理器(1)上还连接有神经元网络拓扑联想处理器(4),在神经元网络拓扑联想处理器(4)上设有中文关键字输出端口(5)。

【技术特征摘要】

【专利技术属性】
技术研发人员:韩伟
申请(专利权)人:韩伟
类型:实用新型
国别省市:86

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1