当前位置: 首页 > 专利查询>洪芳华专利>正文

一种基于特征的非正式短文本情报分析研究方法技术

技术编号:33308030 阅读:45 留言:0更新日期:2022-05-06 12:18
本发明专利技术涉及情报分析研究技术领域,且公开了一种基于特征的非正式短文本情报分析研究方法,所述原始数据源的输出端与数据中心电性连接,所述数据中心的输出端与特征提取模块电性连接,所述特征提取模块的输出端与信息获取模块电性连接,所述信息获取模块的输出端与情报分类检索模块电性连接,所述情报分类检索模块的输出端与情感分析研究模块电性连。通过段落抽取分散模块、短文本抽取模块和词条抽取模块对文本数据中的短文本进行抽取和提取,获得的段落数据、短文本数据和词条数据进入信息获取模块中,通过短文本辨别模块和词条辨别模块对其通过情感的不同通过分类模块进行分类,快速地对大量文本数据中的短文本和词条进行抽取编号。取编号。取编号。

【技术实现步骤摘要】
一种基于特征的非正式短文本情报分析研究方法


[0001]本专利技术涉及情报分析研究
,具体为一种基于特征的非正式短文本情报分析研究方法。

技术介绍

[0002]文本分析研究就是将文本所表达的情感信息量化,研究一段文本所表达的积极的、消极的或者中立的极性,来分析文本的情感倾向性,近年来出现了大量关于文本情感分析的研究,一般可根据性质分为两类,一是基于有监督的情感分析研究,二是基于无监督的情感分析研究,另外也存在一些半监督的情感分析研究,但是现有的文本情报分析研究方法仍然存在一些不足之处,比如现有的本情报分析研究方法对短文本的陈述情感极性判别能力较弱,整体情感元组的提取效率不高。

技术实现思路

[0003](一)解决的技术问题
[0004]针对现有技术的不足,本专利技术提供了一种基于特征的非正式短文本情报分析研究方法,具备可以快速地对大量文本数据中的短文本和词条进行抽取编号,同时根据对比文献通过情感的不同对其进行分类,节约了材料收集的时间,便于后续的分析研究和可以根据需要快速对相关词条进行检索分析,提高了工作效率等优点,解决了现有的本情报分析研究方法对短文本的陈述情感极性判别能力较弱,整体情感元组的提取效率不高的问题。
[0005](二)技术方案
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于特征的非正式短文本情报分析研究方法,包括原始数据源,所述原始数据源的输出端与数据中心电性连接,所述数据中心的输出端与特征提取模块电性连接,所述特征提取模块的输出端与信息获取模块电性连接,所述信息获取模块的输出端与情报分类检索模块电性连接,所述情报分类检索模块的输出端与情感分析研究模块电性连接。
[0007]优选的,所述特征提取模块包括段落抽取分散模块、短文本抽取模块和词条抽取模块,所述段落抽取分散模块的输出端与短文本抽取电性连接,所述短文本抽取模块的输出端与词条抽取模块电性连。
[0008]优选的,所述信息获取模块包括专题对比文献、短文本辨别模块和词条辨别模块,所述专题对比文献的输出端分别与短文本辨别模块和词条辨别模块电性连接。
[0009]优选的,所述情报分类检索模块包括文本情报数据库、人工检索模块、分类模块和智能检索模块,所述分类模块的输出端与文本情报数据库电性连接,所述文本情报数据库的输出端本别与人工检索模块电性连接和智能检测模块电性连接。
[0010]优选的,所述情感分析讲究模块包括特征分析模块、情报分析模块和情报研究模块,所述特征分析模块的输出端与情报分析模块电性连接,所述情报分析模块的输出端与情报研究模块电性连接。
[0011]优选的,所述数据中心的输出端与段落抽取分散模块电性连接。
[0012]优选的,所述短文本辨别模块的输入端与短文本抽取模块电性连接,所述词条辨别模块的输入端与词条抽取模块电性连接。
[0013]优选的,所述分类模块的输出端与词条辨别模块电性连接,所述人工检索模块和智能检索模块的输出端均与特征分析模块电性连接。
[0014]优选的,根据上述的一种基于特征的非正式短文本情报分析研究方法,包括以下步骤:
[0015]S1:定时从数据中心中获得原始数据源的最新文本数据进入特征提取模块中,通过段落抽取分散模块、短文本抽取模块和词条抽取模块对文本数据中的短文本进行抽取和提取,将文本的每个段落分开添加编号如A1、A2、、、An,之后对每个段落中的短文本进行进行抽取,对抽取的短文本进行编号如B1、B2、、、Bn,最后对抽取的短文本中的情感词条进行提取,提取后的词条进行编号,编号为C1、C2、、、Cn;
[0016]S2:之后从专题对比文献中获得常用短文本的和词条的情感信息,S1中获得的段落数据、短文本数据和词条数据进入信息获取模块中,通过短文本辨别模块和词条辨别模块对其通过情感的不同通过分类模块进行分类;
[0017]S3:进入情报分类检索模块中分类的,包含不同情感的短文本和词条储存至文本情报数据库中,在进行情感分析研究时,分别可通过人工检索模块和智能检索模块对其进行检索;
[0018]S4:检索后的短文本和词条进入情感分析研究模块中,通过特征分析模块、情报分析模块和情报研究模块对短文本和词条的情感特征、包含内容和相关信息进行分析。
[0019](三)有益效果
[0020]与现有技术相比,本专利技术提供了一种基于特征的非正式短文本情报分析研究方法,具备以下有益效果:
[0021]1、该一种基于特征的非正式短文本情报分析研究方法,通过段落抽取分散模块、短文本抽取模块和词条抽取模块对文本数据中的短文本进行抽取和提取,获得的段落数据、短文本数据和词条数据进入信息获取模块中,通过短文本辨别模块和词条辨别模块对其通过情感的不同通过分类模块进行分类,可以快速地对大量文本数据中的短文本和词条进行抽取编号,同时根据对比文献通过情感的不同对其进行分类,节约了材料收集的时间,便于后续的分析研究。
[0022]2、该一种基于特征的非正式短文本情报分析研究方法,通过进入情报分类检索模块中分类的,包含不同情感的短文本和词条储存至文本情报数据库中,在进行情感分析研究时,分别可通过人工检索模块和智能检索模块对其进行检索,检索后的短文本和词条进入情感分析研究模块中,通过特征分析模块、情报分析模块和情报研究模块对短文本和词条的情感特征、包含内容和相关信息进行分析,可以根据需要快速对相关词条进行检索分析,提高了工作效率。
附图说明
[0023]图1为本专利技术结构流程示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]请参阅图1,一种基于特征的非正式短文本情报分析研究方法,包括原始数据源,原始数据源的输出端与数据中心电性连接,数据中心的输出端与特征提取模块电性连接,特征提取模块的输出端与信息获取模块电性连接,信息获取模块的输出端与情报分类检索模块电性连接,情报分类检索模块的输出端与情感分析研究模块电性连接。
[0026]特征提取模块包括段落抽取分散模块、短文本抽取模块和词条抽取模块,段落抽取分散模块的输出端与短文本抽取电性连接,短文本抽取模块的输出端与词条抽取模块电性连接,信息获取模块包括专题对比文献、短文本辨别模块和词条辨别模块,专题对比文献的输出端分别与短文本辨别模块和词条辨别模块电性连接,情报分类检索模块包括文本情报数据库、人工检索模块、分类模块和智能检索模块,分类模块的输出端与文本情报数据库电性连接,文本情报数据库的输出端本别与人工检索模块电性连接和智能检测模块电性连接,情感分析讲究模块包括特征分析模块、情报分析模块和情报研究模块,特征分析模块的输出端与情报分析模块电性连接,情报分析模块的输出端与情报研究本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征的非正式短文本情报分析研究方法,包括原始数据源,其特征在于:所述原始数据源的输出端与数据中心电性连接,所述数据中心的输出端与特征提取模块电性连接,所述特征提取模块的输出端与信息获取模块电性连接,所述信息获取模块的输出端与情报分类检索模块电性连接,所述情报分类检索模块的输出端与情感分析研究模块电性连接。2.根据权利要求1所述的一种基于特征的非正式短文本情报分析研究方法,其特征在于:所述特征提取模块包括段落抽取分散模块、短文本抽取模块和词条抽取模块,所述段落抽取分散模块的输出端与短文本抽取电性连接,所述短文本抽取模块的输出端与词条抽取模块电性连接。3.根据权利要求1所述的一种基于特征的非正式短文本情报分析研究方法,其特征在于:所述信息获取模块包括专题对比文献、短文本辨别模块和词条辨别模块,所述专题对比文献的输出端分别与短文本辨别模块和词条辨别模块电性连接。4.根据权利要求1所述的一种基于特征的非正式短文本情报分析研究方法,其特征在于:所述情报分类检索模块包括文本情报数据库、人工检索模块、分类模块和智能检索模块,所述分类模块的输出端与文本情报数据库电性连接,所述文本情报数据库的输出端本别与人工检索模块电性连接和智能检测模块电性连接。5.根据权利要求1所述的一种基于特征的非正式短文本情报分析研究方法,其特征在于:所述情感分析讲究模块包括特征分析模块、情报分析模块和情报研究模块,所述特征分析模块的输出端与情报分析模块电性连接,所述情报分析模块的输出端与情报研究模块电性连接。6.根据权利要求2所述的一种基于特征的非正式短文本情报分析研究方法,其特征在于:所述数据中心的输出端与段...

【专利技术属性】
技术研发人员:洪芳华
申请(专利权)人:洪芳华
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1