The invention belongs to the technical field of non-structural information and resource processing, in particular to a non-structural information processing and resource management system. By using self-defined processing strategy and rule processing scheme, the invention has formed a flexible and fast data acquisition and processing scheme, and can effectively analyze and process non-structural information data, effectively reduce the cost of user learning and use, and improve the efficiency of data processing of non-structural information.
【技术实现步骤摘要】
一种非结构信息处理与资源管理系统
本专利技术属于非结构信息与资源处理
,尤其涉及一种非结构信息处理与资源管理系统。
技术介绍
随着社会经济的发展,人们需要面对越来越庞大的数据处理需求,而信息技术以及自动化控制技术的应用,大大提高实际工作生活中规划和管理的效率,相对而言,传统的生产加工活动主要涉及的是常规数据、表格等结构性数据,由于这些数据具有规范性的书写方式以及特定的数据存储点,能够方便的应用自动分析技术抽取和分类这些结构性信息数据,对结构性信息数据的处理以及研究也是数据处理中的主要部分。但另一方面,随着人们经济生活的提高,社会对精神生活以及文化生活的重视程度也越来越高,大到整个城市间的文化生活的规划,小到街道区域的小型文化活动,其数量以及体量也不断增大,这一方面得益于文化艺术的发展繁荣,也少不了相应的规划分析工作,与传统生活工作不同,文化类等特殊类活动除了少部分涉及具体的时间数量之外,还包含有大量的非结构性信息数据,特别是在用于效果的规划预期,质量的评估分析等内容时,由于个体的片面性,需要从大批量的人群中收集相应的数据信息进行综合评价,而这些评价分析数据基本都是体量以及数量不等的非结构性数据信息,这些非结构性信息数据由于受到个体语言特点以及自身理解的差异,难以有效的进行统一和处理,这为上述工作生活内容的有效执行带来了困难。
技术实现思路
本专利技术创造的目的在于,提供一种能够更方便的处理非结构性信息数据,以提高非结构性信息数据的处理效率,降低工作难度的非结构信息处理与资源管理系统。为实现上述目的,本专利技术创造采用如下技术方案。一种非结构信息处理与资源 ...
【技术保护点】
1.一种非结构信息处理与资源管理系统,其特征在于,由信息管理模块、信息处理模块以及数据采集模块构成;信息管理模块,包括用于实现词库管理操作以实现词库的快速更新,包括修改、增删、检索词语的词库控件;用于实现数据源的增删查找的数据源控件;用于设置不同分类规则以对信息进行分类,包括增删、修改和查找规则的规则控件;用于配置文本分析功能,根据分词或者其他策略的组合形成或者修改信息处理的策略模式的策略控件;用于根据数据源以及策略配置,建立新的任务,并调用相应的数据源以及策略模型,对数据源进行相应的策略处理,并输出相应的数据结果的任务控件;信息处理模块,包括用于对信息进行自动分词,并完成关键信息提取的提取控件;用于完成文本转换、聚类以及对比的处理控件;提取控件采用规则匹配以及模型匹配对文本信息进行自动分词处理,并对词语进行词性标注,同时提取文本的关键字词和关键句作为摘要以便于快速阅览;处理控件还用于根据用户输入的路径录入信息文件,并根据操作历史形成日志文件;日志文件用于支持文件的持续更新读取等;在具体实施过程中,各处理控件表现为可编辑的下拉窗口或者链接至相应数据库的超文本编辑栏;分词处理还包括将信息 ...
【技术特征摘要】
1.一种非结构信息处理与资源管理系统,其特征在于,由信息管理模块、信息处理模块以及数据采集模块构成;信息管理模块,包括用于实现词库管理操作以实现词库的快速更新,包括修改、增删、检索词语的词库控件;用于实现数据源的增删查找的数据源控件;用于设置不同分类规则以对信息进行分类,包括增删、修改和查找规则的规则控件;用于配置文本分析功能,根据分词或者其他策略的组合形成或者修改信息处理的策略模式的策略控件;用于根据数据源以及策略配置,建立新的任务,并调用相应的数据源以及策略模型,对数据源进行相应的策略处理,并输出相应的数据结果的任务控件;信息处理模块,包括用于对信息进行自动分词,并完成关键信息提取的提取控件;用于完成文本转换、聚类以及对比的处理控件;提取控件采用规则匹配以及模型匹配对文本信息进行自动分词处理,并对词语进行词性标注,同时提取文本的关键字词和关键句作为摘要以便于快速阅览;处理控件还用于根据用户输入的路径录入信息文件,并根据操作历史形成日志文件;日志文件用于支持文件的持续更新读取等;在具体实施过程中,各处理控件表现为可编辑的下拉窗口或者链接至相应数据库的超文本编辑栏;分词处理还包括将信息数据中的文本进行分割处理,以将其划分为一个或者多个具有完整语义的字词单元,同时根据自定义或者用户输入或者调取频率进行优先级提取,以便于优先获取高频的关键词,快速形成关键词摘要;以及,基于规则处理以及统计方法相结合,从非结构信息中获取特定的地名、人名、号码等实体数据;数据采集模块,包括用于从数据源中采集数据,调用文本分析服务器相应的服务对数据进行自动处理,并将数据处理结果进行存储的数据采集控件;以及,用于利用规范性数据...
【专利技术属性】
技术研发人员:李刚,石淮,
申请(专利权)人:武汉雨滴科技有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。