【技术实现步骤摘要】
本专利技术属于IT领域,它提供,使得数字化过程中在几乎 不增加成本的情况下,可以获取知识,包括词的分类、认同字及字、词和句子的意义,如 挖掘出文献中的所有人名、地名、事件名等及所有字头字、短语、例句、书名等。数字加工单位通过本专利技术提供的意义标记方法、着重词标记方法、认同字标记方法,在加工一种文献之前定义所要挖掘的知识点,在加工完成后先通过知识生成模块生成格式 规范的知识,再通过知识获取模块挖掘出文献中的分类知识。
技术介绍
随着现代计算机通讯、网络技术的迅猛发展,以内容革命为核心的第二次信息革命正 在世界各国全面铺开,信息资源数字化成为当代信息社会的必需。读者可以通过网络获取 大量的知识,但是数据量太大,虽然可以通过检索縮少范围,但数据仍然是海量的,主要 的原因是数据没有被分类,也就是没有建立知识点供游览者聚类。目前数据内容的知识挖掘已经被越来越多的专家和读者重视,但现有的技术知识挖掘 的成本非常的高,它们都是在数字化后由专家或是专人对原文献逐字阅读,然后在相应位 置标记知识点。
技术实现思路
本专利技术为,包括意义挖掘方法、词挖掘方法、认同字挖掘 方法。一、知 ...
【技术保护点】
一种数字化知识挖掘的方法,包括知识标记方法、知识生成模块、知识获取模块。
【技术特征摘要】
1.一种数字化知识挖掘的方法,包括知识标记方法、知识生成模块、知识获取模块。2. 如权利要求1所述的知识标记方法,包括意义标记方法、词标记方法、认同字标记方法。3. 如权利要求2所述的意义标记方法,包括字体添加意义属性创建字体意义属性,通过意义属性值创建意义,建立知识点,从而使得数字化文献中的内容被赋予了指定的意义; 字体添加意义说明提供意义补充说明手段,对有可能产生二义性的指定的意义提供说明。4. 如权利要求2所述的词标记方法,包括着重词标记创建着重词标记符,它不仅标记着重词类型,还包括词的内容本身; 着重词意义属性创建着重词意义属性,通过词类,建立知识点,从而...
【专利技术属性】
技术研发人员:蒋贤春,郑珑,蓝德康,谢术清,朱人杰,
申请(专利权)人:北京中易中标电子信息技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。