一种文本分析方法及系统技术方案

技术编号:37490496 阅读:37 留言:0更新日期:2023-05-07 09:29
本发明专利技术公开了一种文本分析方法,其通过根据多个第一标准文件构建多维标签池;并根据所述多维标签池分别为多个第二标准文件和多个第三文件自动匹配多维标签,根据所获取的分析条件,匹配得到多维标签的优先层级,并根据该优先层级顺序分别对多个第二标准文件和第三文件进行全文逻辑提取,分别得到相应的第一逻辑信息集和第二逻辑信息集;然后计算第二逻辑信息集与第一逻辑信息集的匹配度,并根据匹配度大于预设阈值的第二逻辑信息集自动生成第一分析报告。一分析报告。一分析报告。

【技术实现步骤摘要】
一种文本分析方法及系统


[0001]本专利技术涉及信息处理
,尤其涉及一种文本分析方法及系统。

技术介绍

[0002]随着文本挖掘分析技术的日趋成熟,其在广电、金融、交通、零售等商业领域的应用越来越广泛。现有的文本分析方法,通常是根据同一词汇的词频高低关系,以及同一词汇的多引文来源匹配信息罗列,如文本分词、文本抽取、频次统计、高频筛选、高频词汇图谱展示。
[0003]例如,申请号为CN202110950273.2的中国专利技术专利申请公开了一种信息的处理方法,其通过数据源层收集获取数据信息,并将收集的数据信息整合至数据原始层,数据原始层分为第一数据库和企业数据库,第一数据信息存储至第一数据库,企业信息储存至企业数据库,对收集到的第一数据信息进行数据处理,得到相应的信息特征,对收集的企业信息进行数据处理,得到每个企业的信息特征,再通过特征信息词汇等为企业匹配合适的第一数据信息,通过构建的企业靶向模型进行相对应的第一数据信息推送。
[0004]再如,申请号为CN202210080919.0的中国专利技术专利申请公开了一种文本逻本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本分析方法,其特征在于,包括步骤:预先根据预设的第一数据库构建多维标签池;所述第一数据库包括多个第一标准文件;所述多维标签池的维度包括至少七维;预先根据所述多维标签池分别为预设的第二数据库中多个第二标准文件和预设第三数据库中多个待分析第三文件自动匹配多维标签;获取用户输入的分析条件,并根据所述分析条件匹配到多维标签的优先层级;按照从最高优先层级到最低优先层级的顺序逐层级分别对所述第二标准文件和所述第三文件进行全文逻辑抽取,得到第一逻辑信息集和第二逻辑信息集;计算所述第二逻辑信息集与所述第一逻辑信息集的匹配度,并判断所述匹配度是否达到预设阈值,若所述匹配度大于或等于预设阈值,根据所述第二逻辑信息集自动生成第一分析报告;其中,所述第二标准文件的优先级大于所述第三文件的优先级。2.根据权利要求1所述的方法,其特征在于,还包括步骤:根据所述多维标签池对预设的第四数据库中的所有待分析第四文件进行全文逻辑抽取,得到第三逻辑信息集;对比分析所述第三逻辑信息集和所述第二逻辑信息集,并根据分析结果生成差异报告;在所述第一分析报告的基础上,结合所述差异报告生成第二分析报告。3.根据权利要求1或2所述的方法,其特征在于,所述第一数据库还包括多个所述第三文件,和/或,多个所述第四文件。4.根据权利要求3所述的方法,其特征在于,根据新的所述第一标准文件或所述第二标准文件或所述第三文件或所述第四文件动态更新所述多维标签池。5.根据权利要求1所述的方法,其特征在于,所述多维标签池的维度为七维,分别为:客观因素、区域、相关性、策略、机遇、扶持标准、时间。6.一种文本分析系统,其特征在于,包括:存储模块,用于存储第一、二、三数据库,所述第一数据库包括多个第一标准文件,所述第二数据库包括多个第二标准文件,所述第三数据库包括多个待分析第三文件,其中,所述第二标准文件的优先级大于所述第三文件的优先级;标签池构建模块,用于根据第一数据库中的所述第一标准文件构建多维标签...

【专利技术属性】
技术研发人员:李丹妮
申请(专利权)人:重庆思达普规划设计咨询服务有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1