一种关键词分析系统与方法技术方案

技术编号:21299223 阅读:30 留言:0更新日期:2019-06-12 07:50
本申请公开了一种关键词分析系统,包括模块:搜索模块,语义分析模块,评价模块。本申请公开了一种关键词分析方法,包括步骤:通过自然语言处理机制,从文档提取关键词;搜索所述关键词,获得关联信息;对所述关联信息的语义分析,获得所述关键词的评价信息;将所述评价信息对照评价度量表,获得所述关键词的评价值。本申请通过引入自然语言处理,进行全局分析,语义分析等,对商业情报进行更加精准的分析与筛选,提高了商业情报分析的准确度。

A Keyword Analysis System and Method

This application discloses a keyword analysis system, including modules: search module, semantic analysis module, evaluation module. This application discloses a keyword analysis method, which includes steps: extracting keywords from documents through natural language processing mechanism; searching for the keywords to obtain related information; obtaining evaluation information of the keywords by semantic analysis of the related information; and comparing the evaluation information with the evaluation scale to obtain the evaluation value of the keywords. This application improves the accuracy of business intelligence analysis by introducing natural language processing, global analysis, semantic analysis and so on.

【技术实现步骤摘要】
一种关键词分析系统与方法
本申请涉及计算机科学领域和人工智能领域,尤其涉及计算机语言与人类(自然)语言之间的交互,用于对商业情报分析进行自然语言处理。
技术介绍
在高速发展的经济环境中,人们需要商业情报来分析竞争力、分析对手、预测行业未来,采取相应的营销活动等。企业通过互联网获取商业情报,是比较快捷的方式,相对于通过其他途径搜集商业情报,效率要高很多。但是互联网上有很多信息,而且企业需要大量的精准商业情报,所以商业情报分析就是一个必不可少的手段,处理大量信息,并从中筛选出最有价值的信息,从而帮助企业作出正确决策。现有常见的商业情报数据分析服务主要有:客户身份认识KYC(Knowyourcustomer);线上个人和机构背景尽职调查;新闻报道和特定事件跟踪分析等。然而,现有服务由于信息检索深度有限,主要基于关键字层面的检索,还是难以从海量数据中非常准确高效的过滤有价值信息。本专利技术通过引入自然语言处理,进行全局分析,语义分析等,对商业情报进行更加精准的分析与筛选,大大提高了商业情报分析的准确度。
技术实现思路
本申请实施例提供一种关键词分析系统和方法,解决现有商业情报分析准确度不够高的问题。本申请实施例提供一种关键词分析系统,包括模块:搜索模块,语义分析模块,评价模块。所述搜索模块,用于搜索关键词的关联信息;所述语义分析模块,用于对所述关联信息进行语义分析,得到对所述关键词的评价信息;所述评价模块,用于根据所述评价信息,对照评价度量表,获得关键词的评价值;所述评价度量表,是对所述评价信息按照级别和/或类别进行赋值。优选的,本申请的系统中,所述关键词,包含以下至少一种:姓名、名称、网址、技术、参数、主题。优选的,本申请的系统中,所述关键词,是通过自然语言处理机制,从文档中提取。优选的,本申请的系统中,所述关键词的评价值,是评价模块对所述关键词的评价信息进行分级,并按照所述评价度量表获得评价值;优选的,本申请的系统中,还包括反馈模块,用于输入分值,并根据分值调节所述评价度量表。本申请实施例还提供一种关键词分析方法,包括以下步骤:搜索关键词,获得关联信息;对所述关联信息的语义分析,获得所述关键词的评价信息;将所述评价信息对照评价度量表,获得所述关键词的评价值。优选的,本申请的方法中,所述关键词,包含以下至少一种:姓名、名称、网址、技术、参数、主题。优选的,本申请的方法中,所述关键词,是通过自然语言处理机制,从文档中提取。优选的,本申请的方法中,所述关键词的评价值,是通过对关键词的搜索,及对搜索结果的语义分析,对所述关键词的评价信息进行分级,并按照所述评价度量表获得评价值。关键词的评价值,是通过全球搜索引擎及数据库的搜索,及对搜索结果的语义分析,对关键词的评价信息进行分级,并按照所述评价度量表获得所述评价值。优选的,本申请的系统或方法中,所述关键词的评价信息,包含以下至少一种:对姓名的声誉或背景的评价;对名称的声誉或背景的评价;对网址的真伪或安全性的评价;对技术的风险或创新性的评价;对参数的可行性的评价;对主题的相关性的评价。优选的,本申请的方法中,还包括步骤:对所述评价值打分,根据分数调整所述评价度量表。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本专利技术通过引入自然语言处理,进行全局分析,语义分析等,对商业情报进行更加精准的分析与筛选,大大提高了商业情报分析的准确度。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为一种关键词分析系统。图2为一种关键词分析方法。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案。图1为一种关键词分析系统。本申请实施例提供一种关键词分析系统,包括以下模块:搜索模块11、语义分析模块12、评价模块13。所述搜索模块,用于搜索关键词的关联信息。例如,在全球主要公开搜索引擎和各类公开和非公开的政府和商业数据库及其名单列表中,对关键词进行检索。搜索到的信息为关键词的关联信息。所述语义分析模块,用于对所述关联信息进行语义分析,得到对所述关键词的评价信息。例如,对搜索模块的搜索结果,即关联信息,进行二次分析。二次分析是基于语义分析,包括根据关键词的的语义背景,排除同名但非同义的信息。语义分析模块的输出结果,是关键词的评价信息。所述评价模块,用于根据所述评价信息,对照评价度量表,获得关键词的评价值。评价度量表,是对评价信息按照级别和/或类别进行赋值。评价度量表用于作为分级后的评价信息的参照表,以便对评价信息进行打分。例如,按不同级别和类比,进行正面和负面信息的排序和归类,再参照评价度量表,获得评价值。评价模块的输出,即为评价值。评价模块的输出,是通过参照评价度量表获得的分值,即评价值。评价值,是对关键词的评价信息的打分,分数是参照评价度量表,按照评价信息的不同级别和类比,进行打分的。评价度量表的内容,是根据对关键词所关联信息的大数据统计获得的,也可以用经验值。作为本专利技术进一步优化的实施例,所述关键词,包含以下至少一种:姓名、名称、网址、技术、参数、主题。所述关键词的评价信息,包含以下至少一种:对姓名或名称的声誉或背景的评价;所述声誉,包含对所述关键词行为的评价;所述背景,包含所述关键词的学历、履历或其它历史;对网址的真伪或安全性的评价;所述网址的安全性,包含对所述网址的黑客行为或攻击行为的评价;对技术的风险或创新性的评价;所述技术风险,包含技术侵权的评价;对参数的可行性的评价;所述参数,包含任一体现某项特征的参数名或数值;对主题的相关性的评价。所述主题相关性,包含与所述主题相关的其它文档的相关度信息评价。例如,对于项目计划书的情报分析,就可以通过对项目计划书中的关键人名进行搜索和分析,获得项目关键人的背景,口碑,正负面评价等信息,作为对项目投资的参考。例如,对提取的关键网站链接,在全球主要公开搜索引擎和各类公开和非公开的反黑客和网络攻击数据库及其名单列表中进行检索,可以确认网站真伪以及安全性,查找是否有不良记录等,作为公司资质的一项参考指标。例如,根据项目计划书中所提取的技术元素,在全球主要公开搜索引擎和各类公开和非公开的技术和专利数据库中进行检索,分析技术的可靠性,是否有侵权等,作为项目参与或项目投资的参考。再例如,通过对文件中所列参数的分析与对比,也可以对该项目的更多细节性资料信息进行对照研究。再例如,从分析该项目计划书的主题入手,在全球主要公开搜索引擎和各类公开和非公开的项目白皮书和商业计划书数据库中进行检索,查找与该主题相似度最高的其它文献资料,再进行研究,也会对研究该项目提供帮助。以上以项目计划书为例,列举了通过自然语言分析,对重要文件的内容进行搜索、研究和判断,可以依照其中一项,也可以根据需要综合分析进行评价。作为本专利技术进一步优化的实施例,所述本文档来自技高网...

【技术保护点】
1.一种关键词分析系统,其特征在于,包括以下模块:搜索模块,语义分析模块,评价模块;所述搜索模块,用于搜索关键词的关联信息;所述语义分析模块,用于对所述关联信息进行语义分析,得到对所述关键词的评价信息;所述评价模块,用于根据所述评价信息,对照评价度量表,获得关键词的评价值;所述评价度量表,是对所述评价信息按照级别和/或类别进行赋值。

【技术特征摘要】
1.一种关键词分析系统,其特征在于,包括以下模块:搜索模块,语义分析模块,评价模块;所述搜索模块,用于搜索关键词的关联信息;所述语义分析模块,用于对所述关联信息进行语义分析,得到对所述关键词的评价信息;所述评价模块,用于根据所述评价信息,对照评价度量表,获得关键词的评价值;所述评价度量表,是对所述评价信息按照级别和/或类别进行赋值。2.如权利要求1所述的一种关键词分析系统,其特征在于,所述关键词,包含以下至少一种:姓名、名称、网址、技术、参数、主题。3.如权利要求1所述的一种关键词分析系统,其特征在于,所述关键词,是通过自然语言处理机制提取。4.如权利要求1所述的一种关键词分析系统,其特征在于,所述关键词的评价值,是评价模块对所述关键词的评价信息进行分级,并按照所述评价度量表获得评价值。5.如权利要求4所述的一种关键词分析系统,其特征在于,所述关键词的评价信息,包含以下至少一种:对姓名的声誉或背景的评价;对名称的声誉或背景的评价;对网址的真伪或安全性的评价...

【专利技术属性】
技术研发人员:包宇王加莹
申请(专利权)人:深圳市祥云万维科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1