当前位置: 首页 > 专利查询>南京大学专利>正文

一种终端辅助SWOT指标体系的构建方法技术

技术编号:20916560 阅读:11 留言:0更新日期:2019-04-20 09:41
本发明专利技术涉及终端集中存储领域,具体为一种终端辅助SWOT指标体系的构建方法,其包括:步骤S100,基于终端对文本数据集的关键词提取;步骤S200,关键词聚类和SWOT指标体系映射;以及步骤S300,生成指标体系权重建议。关键词的自动提取和聚类,有效节省了专家人力资源,并在一定程度上避免了SWOT体系构建过程中人为干扰因素的影响。

A Construction Method of Terminal-Aided SWOT Index System

The invention relates to the field of terminal centralized storage, in particular to a construction method of terminal-assisted SWOT index system, which includes: 00, keyword extraction based on terminal to text dataset; 200, keyword clustering and SWOT index system mapping; and 100, generating index system weight proposals. The automatic extraction and clustering of keywords can effectively save the human resources of experts, and avoid the influence of human interference factors in the process of SWOT system construction to a certain extent.

【技术实现步骤摘要】
一种终端辅助SWOT指标体系的构建方法
本专利技术涉及终端集中存储领域,具体为一种终端辅助SWOT指标体系的构建方法。
技术介绍
SWOT分析方法(其中Strengths:内部优势因素,Weakness:内部弱势因素,Opportunities:外部机遇因素,Threats:外部威胁因素)是一种经典的竞争情报分析工具,由哈佛商学院的K.J.安德鲁斯于1971年在其《公司战略概念》一书中提出。该方法的主要内容是围绕着分析目标进行广泛地调查与信息收集,然后对收集到的信息予以分析,判断影响目标的外部机遇及外部威胁,目标实施的内部优势和劣势四方面因素。SWOT分析方法既可以进行简单的初步分析,定性地了解分析目标的总体概况,同时也可以实现目标的战略策略形成,实施或控制决策。由于SWOT分析方法从分析目标总体出发,可以清晰地列出影响目标实施的优势、劣势、机会和威胁因素,并加以综合分析,将影响目标实施的复杂因素明朗化,决策者可以清楚地掌握目标实施中可能存在的风险与机遇,从而提高决策的准确性。因此SWOT分析方法现已成为现代政府部门、企业在管理与决策中最为常用的分析工具,得到了广泛的应用与研究。基于上述技术问题需要设计一种新的终端辅助SWOT指标体系的构建方法。
技术实现思路
本专利技术的目的是提供一种终端辅助SWOT指标体系的构建方法。为了解决上述技术问题,本专利技术提供了一种终端辅助SWOT指标体系的构建方法,包括:步骤S100,对文本数据集的关键词提取;步骤S200,关键词聚类和SWOT指标体系映射;以及步骤S300,生成指标体系权重建议。进一步,所述步骤S100中对文本数据集的关键词提取的方法包括:步骤S101,停用词过滤,对采集的文本数据集进行中文分词之后,通过积累挑选形成的停用词表,过滤文本数据中的停用词;步骤S102,特定词过滤,通过搜索引擎对词进行搜索,对于搜索结果少于阈值的词,判断其为特定词,然后将特定词过滤;步骤S103,关键词提取,通过改进的TF/IDF算法进行关键词提取。进一步,所述改进的TF/IDF算法为:式1式2Wi={W|TF/IDF(wi)>η};式3W=∪Wi;式4式中,TF/IDF(wi)为标号为i的文本数据中词w的TF/IDF权值;TF(wi)为词w在标号为i的文本数据中出现的频数;N为文本数据集包含的文本数据数;d为包含词w的文本数据数;所述通过改进的TF/IDF算法进行关键词提取的方法包括:通过式1计算出文本数据集中每个文本数据中包含的关键词的TF/IDF权值;根据各文本数据中关键词的TF/IDF权值按大小进行排序;提取权值大于阈值η的关键词形成标号为i的文本数据的关键词集合Wi,所有文本数据的Wi集合汇总为文本数据集的关键词W集合;针对W集合中的关键词两两配对,计算比值C;式4中TFsum(Wa)指某关键词a在W集合中出现的频数累加和,TFsum(Wb)是指某关键词b在W集合中出现的频数累加和,G(Wa)是指该关键词a在搜索引擎中获取的检索页面结果数;G(Wb)是指该关键词b在搜索引擎中获取的检索页面结果数;比值C为一对关键词a和b的TFsum值与G值的乘积的比值,并且按比值的结果对W集合中的关键词排序,并按顺序显示以对关键词加以修正。进一步,所述步骤S200中关键词聚类和SWOT指标体系映射的方法包括:步骤S201,依据中国分类主题词表,实现对关键词的初次分类,对照中国分类主题词表,将当前文本数据集中提取出的关键词进行分类,建立初始的关键词分类结构;步骤S202,针对初步分类后,剩余的在中国分类主题词表中无法对应分类的关键词,依据词的近义程度作为词与词的距离度量,采用K_MEANS聚类方法对剩余关键词进行聚类;步骤S203,在终端辅助聚类完成之后,再将聚类后的关键词分类展现并修正;步骤S204,经过对关键词聚类的重复迭代以及对聚类后的关键词分类修正后,根据聚类后的词类的分类信息,将词类映射成对应地指标,即建立SWOT分析的指标体系。进一步,所述步骤S300中生成指标体系权重建议的方法包括:选择影响指标体系权重判断的因素;所述影响指标体系权重判断的因素包括:词类包含的关键词的词量:通过分析关键词聚类过程中生成的各词类所包含的关键词数量,以判断该词类所映射生成指标权重,即关键词数量越多的词类其对应的指标权重越大;词类包含的关键词的词频:为词类中包含的所有关键词在文本数据集中出现的频次累计和;以及词类包含的关键词的时效性:为一个词类包含的关键词在时间维度上的词频统计显示出该关键词在时间维度上被关注的程度。进一步,所述步骤S300中生成指标体系权重建议的方法还包括:基于影响指标体系权重判断的因素构建指标体系权重建议的生成公式,即式中,R(W)为一个词类对应的指标权重建议;i从1到k为该词类中包含的关键词数,依次对该类中所有关键词进行计算;j从1到d为包括该词类中某个词w的文本数据,依次对包含该词w的所有文本数据进行计算;遍历包含词w的文本数据,分别计算第j个包含词w的时间衰减函数;TF(wj)为词w在文本数据j中出现的频次;e-μ(t-tc)为时间衰减函数;μ为衰减常数;t为该文本数据出现的时间;tc为当前时刻;计算各词类的R(W)权重建议值之后生成指标权重建议。本专利技术的有益效果是,本专利技术基于终端对文本数据集的关键词提取,并且将关键词聚类和SWOT指标体系映射;以及生成指标体系权重建议,实现了关键词的自动提取和聚类。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是本专利技术所涉及的终端辅助SWOT指标体系的构建方法的流程图。具体实施方式现在结合附图对本专利技术作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本专利技术的基本结构,因此其仅显示与本专利技术有关的构成。实施例1图1是本专利技术所涉及的终端辅助SWOT指标体系的构建方法的流程图。如图1所示,本实施例提供了一种终端辅助SWOT指标体系的构建方法,包括:步骤S100,基于终端对文本数据集的关键词提取;步骤S200,关键词聚类和SWOT指标体系映射;以及步骤S300,生成指标体系权重建议;在本实施中,终端可以但不限于采用计算机,以对SWOT指标体系的构建进行辅助;关键词的自动提取和聚类,有效节省了专家人力资源,并在一定程度上避免了SWOT体系构建过程中人为干扰因素的影响。在本实施例中,所述步骤S100,基于终端对文本数据集的关键词提取的方法包括:步骤S101,停用词过滤,对终端采集的文本数据集进行中文分词之后,通过积累挑选形成的停用词表,过滤文本数据中的停用词,所述停用词一般是语气助词、虚词以及数量词等;步骤S102,特定词过滤,通过搜索引擎对词进行搜索,对于搜索结果少于阈值的词,判断其为特定词,然后将特定词过滤,所述特定词一般为地名、人名等指向性很强的特定词;不同于停用词,特定词难以通过定制词表来进行过滤,在相关的研究工作中,很多实用词分类推理来实现特定词的归类,判断词是否是地名、人名等,但是这种推断存在一定的不可靠性;使用搜索引擎,如Google、百度等,来判断特定词;例如Google每次搜索时都会显示搜索的结果数,使用特定词进行搜索会得到较少的搜索页面数,因此对于搜索结果少于一定阈值的词,可以判断其为特定词,予以过滤;Go本文档来自技高网...

【技术保护点】
1.一种终端辅助SWOT指标体系的构建方法,其特征在于,包括:步骤S100,对文本数据集的关键词提取;步骤S200,关键词聚类和SWOT指标体系映射;以及步骤S300,生成指标体系权重建议。

【技术特征摘要】
1.一种终端辅助SWOT指标体系的构建方法,其特征在于,包括:步骤S100,对文本数据集的关键词提取;步骤S200,关键词聚类和SWOT指标体系映射;以及步骤S300,生成指标体系权重建议。2.如权利要求1所述的构建方法,其特征在于,所述步骤S100中对文本数据集的关键词提取的方法包括:步骤S101,停用词过滤,对采集的文本数据集进行中文分词之后,通过积累挑选形成的停用词表,过滤文本数据中的停用词;步骤S102,特定词过滤,通过搜索引擎对词进行搜索,对于搜索结果少于阈值的词,判断其为特定词,然后将特定词过滤;步骤S103,关键词提取,通过改进的TF/IDF算法进行关键词提取。3.如权利要求2所述的构建方法,其特征在于,所述改进的TF/IDF算法为:式1式2Wi={W|TF/IDF(wi)>η};式3W=∪Wi;式4式中,TF/IDF(wi)为标号为i的文本数据中词w的TF/IDF权值;TF(wi)为词w在标号为i的文本数据中出现的频数;N为文本数据集包含的文本数据数;d为包含词w的文本数据数;所述通过改进的TF/IDF算法进行关键词提取的方法包括:通过式1计算出文本数据集中每个文本数据中包含的关键词的TF/IDF权值;根据各文本数据中关键词的TF/IDF权值按大小进行排序;提取权值大于阈值η的关键词形成标号为i的文本数据的关键词集合Wi,所有文本数据的Wi集合汇总为文本数据集的关键词W集合;针对W集合中的关键词两两配对,计算比值C;式4中TFsum(Wa)指某关键词a在W集合中出现的频数累加和,TFsum(Wb)是指某关键词b在W集合中出现的频数累加和,G(Wa)是指该关键词a在搜索引擎中获取的检索页面结果数;G(Wb)是指该关键词b在搜索引擎中获取的检索页面结果数;比值C为一对关键词a和b的TFsum值与G值的乘积的比值,并且按比值的结果对W集合中的关键词排序,并按顺序显示以对关键词加以修正。4.如权利要求3所述的构建方法,其特征在于,所述步骤S200,关键词...

【专利技术属性】
技术研发人员:石进韩进金鹏
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1