一种基于语义分析的数据处理系统及方法技术方案

技术编号：15329492 阅读：118 留言：0更新日期：2017-05-16 13:09

本发明专利技术提供一种基于语义分析的数据处理系统和方法，包括：数据筛选模块对目标数据进行分割并建立次级结构；数据分析模块对分割后数据的次级结构进行语义分析并对结果建立索引；运算模块对所述的索引进行逐项运算并记录运算结果；联合模块依索引运算记录，将索引对应的数据进行关联。本发明专利技术应用于小数据或含有结构的数据时，较单纯使用语义分析高效和简便。

Data processing system and method based on semantic analysis

The invention provides a semantic analysis of the data processing system and method based on data filtering module includes: segmentation of the target data and establish a secondary structure; data analysis module of the secondary structure of segmented data semantic analysis and indexing of the operation of the module; the index for each operation and record the operation result the joint operation module; ISO cited records, the index corresponding data association. When applied to small data or structured data, the method is more efficient and simpler than simply using semantic analysis.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义分析的数据处理系统及方法
本专利技术属于人工智能领域，尤其是涉及一种信息分析与处理

技术介绍
通过计算机对数据进行运算和关联是一种常见需求。搜索引擎是一种简单化的方式，其优点在于精度高和简便性。但是搜索引擎有很强的局限性：只能搜索关键词相关内容；无法识别关键词的语义并进一步处理；无法对数据进行多对多处理。语义分析是一种有效的处理方式，通过对不同的数据进行分析，可使计算机理解数据的语义，而不被语言的表达形式所限制。但是现有的语义分析算法复杂，精度低，软硬件和时间开支庞大。语义分析精度严重依赖大量的统计，当数据过少时，语义分析很难建立足够的精度。常见数据一般都包含一定的非语义结构，语义分析并不能理解和利用这些结构。
技术实现思路
针对上述存在的问题，本专利技术提供一种数据处理系统，可以克服现有搜索引擎使用有局限而语义分析复杂低效的问题，有效利用数据本身的非语义结构，并优化小数据的语义分析效果。本专利技术提供一种数据处理系统，包括：数据筛选模块：对不同数据进行分割，可使用语义分析或其他方法对数据进行结构分割以建立次级结构。特别的，数据的次级结构可以重叠，并且可以是数据自身。数据分析模块：对所述分割后数据的某次级结构进行语义分析，并用结果建立索引。对同一笔数据的多个不同结构可以进行相应的多次分析并建立多个索引。运算模块：对所述的索引进行逐项运算，依运算结果对索引进行记录。联合模块：依索引运算记录，将索引对应的数据进行关联。本专利技术提供了一种数据处理方法，包括以下步骤：对目标数据进行分割；对分割后数据的某部分或全部进行语义分析并对结果建立索引；对...
一种基于语义分析的数据处理系统及方法

【技术保护点】
一种基于语义分析的数据处理系统，其特征在于，包括：通过数据筛选模块：对不同数据进行分割并建立次级结构；通过数据分析模块对所述次级结构进行逐项语义分析并建立索引；通过运算模块对所述索引进行逐项运算并进行记录；联合模块依运算结果对所述语义索引对应数据进行关联。

【技术特征摘要】
1.一种基于语义分析的数据处理系统，其特征在于，包括：通过数据筛选模块：对不同数据进行分割并建立次级结构；通过数据分析模块对所述次级结构进行逐项语义分析并建立索引；通过运算模块对所述索引进行逐项运算并进行记录；联合模块依运算结果对所述语义索引对应数据进行关联。2.如权利要求1所述数据筛选模块，其特征在于，可使用语义分析或其他方法对数据进行结构分割以建立次级结构；特别的，数据的次级结构可以重叠，并且可以是数据自身。3.如权利要求1所述数据分析模块，其特征在于，对所述分割后数据的某次级结构进行语义分析，并用结果建立索引；特别的，对同一笔数据的多个不同次级结构可...

【专利技术属性】
技术研发人员：李隆烽，
申请(专利权)人：李隆烽，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人