提取重要关键字的方法和执行所述方法的服务器技术

技术编号:11935373 阅读:72 留言:0更新日期:2015-08-26 02:47
一种通过重要关键字提取服务器来提取重要关键字的方法,所述方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过服务器基于一个或更多个用户定义关键字来确定用于每个字的权重;通过服务器来将用于每个字的权重应用于每个字的相对重要性值;通过服务器基于应用了权重的相对重要性值来将至少一个字确定为重要关键字;以及通过服务器来将重要关键字传送至用户终端。因此,所述方法可以从至少一个文件中有效地检测用户定义关键字。

【技术实现步骤摘要】
提取重要关键字的方法和执行所述方法的服务器相关申请的交叉引用本申请要求2013年11月11日提交的申请号为10-2013-0136564的韩国专利申请的较早申请日的权益以及优先权,该申请的全部内容通过引用合并于此。
本公开的实施例涉及提取重要关键字的计算机可执行技术,且更具体而言,涉及从一个或更多个文件中提取重要关键字的方法和执行所述方法的服务器。
技术介绍
关键字分析使用模式匹配技术来分析句子的内容。在关键字分析过程中,可以基于分析器的主观经验来确定关键字,然后在目标文件的搜索中将其与搜索关键字相匹配。由于相关技术中的关键字分析使用由分析器主观选择的字作为重要的字,这种关键字分析可能未使用在目标文件中实际重要的关键字。
技术实现思路
本公开的实施例针对一种基于用户定义关键字从至少一个文件中有效地提取重要关键字的方法。本公开的实施例针对一种通过确定在至少一个文件中检测出的字的相对重要性并将用户定义关键字的权重应用于所述字的相对重要性来提取重要关键字的方法。本公开的实施例针对一种提取重要关键字并将具有包括重要关键字的至少一个关键字列表提供给用户的方法。在一些实施例中,一种通过重要关键字提取服务器来提取重要关键字的方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过服务器基于一个或更多个用户定义关键字来确定用于每个字的权重;通过服务器来将用于每个字的权重应用于每个字的相对重要性值;通过服务器基于应用了权重的相对重要性值来将至少一个字确定为重要关键字;以及通过服务器来将重要关键字传送至用户终端。在一个实施例中,计算相对重要性值可以包括:通过对特定的字在一个或更多个特定文件中出现的次数和包含所述一个或更多个特定文件的一个或更多个文件中所包括的全部的字的数目执行算术运算,来确定在所述一个或更多个特定文件中检测出的特定的字的初始重要性值。计算相对重要性值还可以包括:确定包含特定的字的一个或更多个特定文件的数目与一个或更多个文件的总数目的比,其中,通过对特定的字的初始重要性值和所述比执行算术运算来计算相对重要性值。确定用于每个字的权重还可以包括:将来自用户终端的一个或更多个用户定义关键字和用于所述一个或更多个用户定义关键字的相应权重储存在数据库中;在所述一组文件中搜索与至少一个用户定义关键字相匹配的至少一个字;搜索用于与所述至少一个字相匹配的至少一个用户定义关键字的相应权重;以及基于用于所述至少一个用户定义关键字的相应权重来确定用于每个字的权重。在一个实施例中,搜索所述至少一个字可以包括:基于在所述一组文件中检测出的字的缩写来搜索所述至少一个字。在一个实施例中,所述方法还可以包括:在所述一个或更多个文件中分析字的词素(morpheme),并且基于词素分析的结果来检测包括名词的字。在本文中,名词可以包括普通名词、专有名词和复合名词。在一个实施例中,所述一个或更多个用户定义关键字可以包括由多个关键字组成的一组关键字。在一个实施例中,所述方法还可以包括:从用户终端接收用于所述一个或更多个用户定义关键字的权重,以及将所述一个或更多个用户定义关键字和用于所述一个或更多个用户定义关键字的权重储存在数据库中。在一个实施例中,所述方法还可以包括:计算所述一个或更多个用户定义关键字的相对重要性值;基于所述一个或更多个用户定义关键字的计算出的相对重要性值来确定用于所述一个或更多个用户定义关键字的权重;以及将所述一个或更多个用户定义关键字和用于所述一个或更多个用户定义关键字的权重储存在数据库中。在一个实施例中,所述方法还可以包括:从所述一组文件中所检测出的字中检测与所述一个或更多个用户定义关键字相似的字,以及将所述相似的字储存在存储器中。将所述至少一个字确定为重要关键字还可以包括:将具有等于或高于预定值的加权相对重要性值的至少一个字确定为重要关键字。所述方法还可以包括从用户终端接收包括与用户所请求的关键字的数目有关的信息的请求,其中,传送重要关键字包括将与关键字的数目相对应的重要关键字传送至用户终端。在一些实施例中,一种系统包括处理器、非暂存性计算机可读媒介,所述非暂存性计算机可读媒介在其上储存有指令,当执行所述指令时,使处理器执行如下方法,所述方法包括:计算在一个或更多个文件中检测出的每个字的相对重要性值;将每个字与一个或更多个用户定义关键字进行比较;如果至少一个字与至少一个用户定义关键字相匹配,则将用于所述至少一个用户定义关键字的权重应用于所述至少一个字的相对重要性值;将具有高重要性值的至少一个字确定为重要关键字;以及将重要关键字传送至用户终端。在一个实施例中,计算相对重要性值可以包括:通过对特定的字在一个或更多个特定文件中出现的次数和包含所述一个或更多个特定文件的一个或更多个文件中所包括的全部的字的数目执行算术运算,来确定在所述一个或更多个特定文件中检测出的所述特定的字的初始重要性值;确定所述一个或更多个特定文件的数目与所述一个或更多个文件的数目的比;以及通过对所述特定的字的初始重要性值和所述比执行算术运算来计算每个字的相对重要性值。在一个实施例中,所述方法还可以包括:分析一个或更多个文件中所包括的字的词素,以及基于词素分析的结果来检测包含名词的字。比较每个字还可以包括:确定在所述一个或更多个文件中检测出的字中哪些字具有高相对重要性值,以及将具有高相对重要性值的字与所述一个或更多个用户定义关键字进行比较。在一个实施例中,所述方法还可以包括从用户终端接收包括与用户所请求的关键字的数目有关的信息的请求,其中,传送重要关键字包括将与关键字的数目相对应的重要关键字传送至用户终端。在一些实施例中,一种非暂存性计算机可读媒介,所述非暂存性计算机可读媒介在其上储存有计算机可执行指令,当处理器执行所述指令时,执行如下方法,所述方法包括:计算在一个或更多个文件中检测出的每个字的相对重要性值;将每个字与一个或更多个用户定义关键字进行比较,以及如果至少一个字与至少一个用户定义关键字相匹配,则将用于所述至少一个用户定义关键字的权重应用于所述至少一个字的相对重要性值,以确定所述至少一个字的重要性值;将具有高重要性值的至少一个字确定为重要关键字;以及将重要关键字传送至用户终端。在一个实施例中,计算相对重要性值可以包括:通过对特定的字在一个或更多个特定文件中出现的次数和包含所述一个或更多个特定文件的一个或更多个文件中所包括的全部的字的数目执行算术操作,来确定在所述一个或更多个特定文件中检测出的特定的字的初始重要性值;确定所述一个或更多个特定文件的数目与所述一个或更多个文件的数目的比;以及通过对所述特定的字的初始重要性值和所述比执行算术运算,来计算每个字的相对重要性值。本公开的实施例可以在至少一个文件中有效地检测重要关键字。本公开的实施例可以确定在至少一个文件中检测出的字的相对重要性,以及将用户定义关键字的权重应用于检测出的字的相对重要性以找到重要关键字。本公开的实施例可以提供至少一个关键字列表,所述至少一个关键字列表包括基于在至少一个文件中检测出的字的重要性而确定出的重要关键字。附图说明图1是说明根据本公开的一个实施例的重要关键字提取系统的框图。图2是本文档来自技高网...

【技术保护点】
一种通过重要关键字提取服务器来提取重要关键字的方法,所述方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过所述服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过所述服务器基于所述一个或更多个用户定义关键字来确定用于所述每个字的权重;通过所述服务器将用于所述每个字的权重应用于所述每个字的相对重要性值;通过所述服务器,基于应用了所述权重的所述相对重要性值,来将至少一个字确定为所述重要关键字;以及通过所述服务器来将所述重要关键字传送至所述用户终端。

【技术特征摘要】
2013.11.11 KR 10-2013-01365641.一种通过重要关键字提取服务器来提取重要关键字的方法,所述方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过所述服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过所述服务器来以所述一个或更多个用户定义关键字为基础确定用于所述每个字的权重;通过所述服务器将用于所述每个字的权重应用于所述每个字的相对重要性值;通过所述服务器,基于应用了所述权重的所述相对重要性值,来将至少一个字确定为所述重要关键字;以及通过所述服务器来将所述重要关键字传送至所述用户终端,其中,确定用于所述每个字的权重包括:将来自所述用户终端的所述一个或更多个用户定义关键字储存在数据库中,并将用于所述一个或更多个用户定义关键字的相应权重储存在数据库中,其中,所述用于所述一个或更多个用户定义关键字的相应权重来自所述用户终端或通过如下方式确定:所述服务器计算所述一个或更多个用户定义关键字的相对重要性值,并通过所述服务器,基于所述一个或更多个用户定义关键字的计算出的相对重要性值,来确定用于所述一个或更多个用户定义关键字的权重;在所述一组文件中搜索与至少一个用户定义关键字相匹配的至少一个字;搜索用于与所述至少一个字相匹配的所述至少一个用户定义关键字的相应权重;以及基于用于所述至少一个用户定义关键字的相应权重来确定用于所述每个字的权重,其中,计算所述相对重要性值包括:通过对特定的字在一个或更多个特定文件中出现的次数和包含所述一个或更多个特定文件的所述一个或更多个文件中所包括的全部的字的数目执行算术运算,来确定在所述一个或更多个特定文件中检测出的所述特定的字的初始重要性值,其中,计算所述相对重要性值还包括:确定包括所述特定的字的所述一个或更多个特定文件的数目与所述一个或更多个文件的总数目的比;以及通过对所述特定的字的所述初始重要性值和所述比执行算术运算,来计算所述相对重要性值。2.如权利要求1所述的方法,其中,搜索所述至少一个字包括:基于在所述一组文件中检测出的字的缩写来搜索所述至少一个字。3.如权利要求1所述的方法,还包括:通过所述服务器来分析所述一个或更多个文件中的字的词素;以及通过所述服务器基于所述词素分析的结果来检测包括名词的字。4.如权利要求3所述的方法,其中,所述名词包括普通名词、专有名词和复合名词。5.如权利要求1所述的方法,其中,所述一个或更多个用户定义关键字包括由多个关键字组成的一组关键字。6.如权利要求1所述的方法,还包括:通过所述服务器从在所述一组文件中检测出的字中检测与所述一个或更多个用户定义关键字相似的字;以及将所述相似的字储存在存储器中。7.如权利要求1所述的方法,其中,将所述至少一个字确定成所述重要关键字还包括:将具有等于或高于预定值的加权相对重要性值的至少一个字确定为所述重要关键字。8.如权利要求1所述的方法,还包括从所述用户终端接收包括与用户所请求的关键字的数目有关的信息的请求,其中,传送所述重要关键字包括将与关键字的数目相对应的重要关键字传送至所述用户终端。9.一种系统,包括:处理器;以及非暂存性计算机可读媒介,所述非暂存性计算机可读媒介在其上储存有指令,当执行所述指令时,使所述处理器执行如下方法,所述方法包括:计算在一个或更多个文件中检测出的每个字的相对重要性值;将所述每个...

【专利技术属性】
技术研发人员:李信泰金炫杓金在万尹宣敏尹草珑张愈眞郑因哲池泰昌
申请(专利权)人:乐金信世股份有限公司
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1