【技术实现步骤摘要】
提取重要关键字的方法和执行所述方法的服务器相关申请的交叉引用本申请要求2013年11月11日提交的申请号为10-2013-0136564的韩国专利申请的较早申请日的权益以及优先权,该申请的全部内容通过引用合并于此。
本公开的实施例涉及提取重要关键字的计算机可执行技术,且更具体而言,涉及从一个或更多个文件中提取重要关键字的方法和执行所述方法的服务器。
技术介绍
关键字分析使用模式匹配技术来分析句子的内容。在关键字分析过程中,可以基于分析器的主观经验来确定关键字,然后在目标文件的搜索中将其与搜索关键字相匹配。由于相关技术中的关键字分析使用由分析器主观选择的字作为重要的字,这种关键字分析可能未使用在目标文件中实际重要的关键字。
技术实现思路
本公开的实施例针对一种基于用户定义关键字从至少一个文件中有效地提取重要关键字的方法。本公开的实施例针对一种通过确定在至少一个文件中检测出的字的相对重要性并将用户定义关键字的权重应用于所述字的相对重要性来提取重要关键字的方法。本公开的实施例针对一种提取重要关键字并将具有包括重要关键字的至少一个关键字列表提供给用户的方法。在一些实施例中,一种通过重要关键字提取服务器来提取重要关键字的方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过服务器基于一个或更多个用户定义关键字来确定用于每个字的权重;通过服务器来将用于每个字的权重应用于每个字的相对重要性值;通过服务器基于应用了权重的相对重要性值来将至少一个字确定为重要关键字;以及通过服务器来 ...
【技术保护点】
一种通过重要关键字提取服务器来提取重要关键字的方法,所述方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过所述服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过所述服务器基于所述一个或更多个用户定义关键字来确定用于所述每个字的权重;通过所述服务器将用于所述每个字的权重应用于所述每个字的相对重要性值;通过所述服务器,基于应用了所述权重的所述相对重要性值,来将至少一个字确定为所述重要关键字;以及通过所述服务器来将所述重要关键字传送至所述用户终端。
【技术特征摘要】
2013.11.11 KR 10-2013-01365641.一种通过重要关键字提取服务器来提取重要关键字的方法,所述方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过所述服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过所述服务器来以所述一个或更多个用户定义关键字为基础确定用于所述每个字的权重;通过所述服务器将用于所述每个字的权重应用于所述每个字的相对重要性值;通过所述服务器,基于应用了所述权重的所述相对重要性值,来将至少一个字确定为所述重要关键字;以及通过所述服务器来将所述重要关键字传送至所述用户终端,其中,确定用于所述每个字的权重包括:将来自所述用户终端的所述一个或更多个用户定义关键字储存在数据库中,并将用于所述一个或更多个用户定义关键字的相应权重储存在数据库中,其中,所述用于所述一个或更多个用户定义关键字的相应权重来自所述用户终端或通过如下方式确定:所述服务器计算所述一个或更多个用户定义关键字的相对重要性值,并通过所述服务器,基于所述一个或更多个用户定义关键字的计算出的相对重要性值,来确定用于所述一个或更多个用户定义关键字的权重;在所述一组文件中搜索与至少一个用户定义关键字相匹配的至少一个字;搜索用于与所述至少一个字相匹配的所述至少一个用户定义关键字的相应权重;以及基于用于所述至少一个用户定义关键字的相应权重来确定用于所述每个字的权重,其中,计算所述相对重要性值包括:通过对特定的字在一个或更多个特定文件中出现的次数和包含所述一个或更多个特定文件的所述一个或更多个文件中所包括的全部的字的数目执行算术运算,来确定在所述一个或更多个特定文件中检测出的所述特定的字的初始重要性值,其中,计算所述相对重要性值还包括:确定包括所述特定的字的所述一个或更多个特定文件的数目与所述一个或更多个文件的总数目的比;以及通过对所述特定的字的所述初始重要性值和所述比执行算术运算,来计算所述相对重要性值。2.如权利要求1所述的方法,其中,搜索所述至少一个字包括:基于在所述一组文件中检测出的字的缩写来搜索所述至少一个字。3.如权利要求1所述的方法,还包括:通过所述服务器来分析所述一个或更多个文件中的字的词素;以及通过所述服务器基于所述词素分析的结果来检测包括名词的字。4.如权利要求3所述的方法,其中,所述名词包括普通名词、专有名词和复合名词。5.如权利要求1所述的方法,其中,所述一个或更多个用户定义关键字包括由多个关键字组成的一组关键字。6.如权利要求1所述的方法,还包括:通过所述服务器从在所述一组文件中检测出的字中检测与所述一个或更多个用户定义关键字相似的字;以及将所述相似的字储存在存储器中。7.如权利要求1所述的方法,其中,将所述至少一个字确定成所述重要关键字还包括:将具有等于或高于预定值的加权相对重要性值的至少一个字确定为所述重要关键字。8.如权利要求1所述的方法,还包括从所述用户终端接收包括与用户所请求的关键字的数目有关的信息的请求,其中,传送所述重要关键字包括将与关键字的数目相对应的重要关键字传送至所述用户终端。9.一种系统,包括:处理器;以及非暂存性计算机可读媒介,所述非暂存性计算机可读媒介在其上储存有指令,当执行所述指令时,使所述处理器执行如下方法,所述方法包括:计算在一个或更多个文件中检测出的每个字的相对重要性值;将所述每个...
【专利技术属性】
技术研发人员:李信泰,金炫杓,金在万,尹宣敏,尹草珑,张愈眞,郑因哲,池泰昌,
申请(专利权)人:乐金信世股份有限公司,
类型:发明
国别省市:韩国;KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。