一种高保真文本主语义提取系统及方法技术方案

技术编号：35840499 阅读：15 留言：0更新日期：2022-12-03 14:12

本发明专利技术提供了一种高保真文本主语义提取系统及方法，涉及数据处理技术领域，通过匹配文本类型生成类型约束参数，匹配文本作者写作特征生成用户特征语义约束参数，对文本进行多层级分割生成文本的多层级分割结果，通过类型约束参数和用户特征语义约束参数对多层级分割结果进行文本分割聚合选择，基于文本类型匹配识别数据库进行文本分割聚合选择结果的语义识别，基于语义识别结果生成语义提取结果。解决现有技术中存在智能识别文本语义准确度较低，无法获得较为准确的文章主语义的缺陷，导致文本语义识别的人工依赖度和识别成本较高的技术问题。达到提高智能识别文本语义准确度，降低文本语义识别对于人工经验的需求，降低识别成本的技术效果。低识别成本的技术效果。低识别成本的技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种高保真文本主语义提取系统及方法

[0001]本专利技术涉及数据处理
，具体涉及一种高保真文本主语义提取系统及方法。

技术介绍

[0002]随着人工智能的发展，用于进行文本语义识别标注的机器人或智能软硬件如雨后春笋般层出不穷，基于人工智能进行准确高效的语义识别标注的美好愿景与人工智能进行语义识别准确度现状仍存在较大的落差。
[0003]这一客观落差的存在与人类语言表达的多样性和复杂性相关，因而如何提高基于智能识别的文本语义提取准确度成为当前降低文本语义提取成本和人力资源消耗的重要方向。
[0004]现有技术中存在智能识别文本语义准确度较低，无法获得较为准确的文章主语义的缺陷，导致文本语义识别的人工依赖度和识别成本仍旧居高不下的技术问题。

技术实现思路

[0005]本申请提供了一种高保真文本主语义提取系统及方法，用于针对解决现有技术中存在智能识别文本语义准确度较低，无法获得较为准确的文章主语义的缺陷，导致文本语义识别的人工依赖度和识别成本仍旧居高不下的技术问题。
[0006]鉴于上述问题，本申请提供了一种高保真文本主语义提取系统及方法。
[0007]本申请的第一个方面，提供了一种高保真文本主语义提取系统，所述系统包括：文本处理执行模块，用于获得目标识别文本，对所述目标识别文本进行文本预处理，得到预处理文本；文本类型匹配模块，用于对所述预处理文本进行初始文本识别，基于初始文本识别结果匹配文本类型，基于所述文本类型生成类型约束参数；写作特征匹配模块，用于基于所述目标识...

【技术保护点】

【技术特征摘要】
1.一种高保真文本主语义提取系统，其特征在于，所述系统包括：文本处理执行模块，用于获得目标识别文本，对所述目标识别文本进行文本预处理，得到预处理文本；文本类型匹配模块，用于对所述预处理文本进行初始文本识别，基于初始文本识别结果匹配文本类型，基于所述文本类型生成类型约束参数；写作特征匹配模块，用于基于所述目标识别文本获得文本作者信息，通过所述文本作者信息进行写作特征匹配，通过写作特征匹配结果生成用户特征语义约束参数；文本分割执行模块，用于对所述预处理文本进行文本多层级分割，生成预处理文本的多层级分割结果；聚合处理执行模块，用于通过所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择，获得文本分割聚合选择结果；语义识别处理模块，用于基于文本类型匹配识别数据库，基于所述识别数据库进行所述文本分割聚合选择结果的语义识别，基于语义识别结果生成语义提取结果。2.根据权利要求1所述的系统，其特征在于，所述系统还包括：词性特征构建单元，用于构建词性识别特征；初始层级划分单元，用于基于所述词性识别特征进行所述预处理文本的初始词性识别划分，获得初始层级分割结果；分割结果聚合单元，用于对所述初始层级分割结果进行相邻分割词聚合评价，生成相邻分割词聚合评价结果；评价结果判断单元，用于判断所述相邻分割词聚合评价结果是否满足预设聚合评价阈值；判断结果执行单元，用于当所述相邻分割词聚合评价结果可以满足所述预设聚合评价阈值时，则进行相邻分割词聚合，其中，每一组相邻分割词聚合方案对应一层级分割结果；分割结果整合单元，用于根据相邻分割词聚合结果和所述初始层级分割结果获得所述多层级分割结果。3.根据权利要求2所述的系统，其特征在于，所述系统还包括：成语词库构建单元，用于构建成语词库集合；分割结果判断单元，用于基于所述成语词库集合进行所述多层级分割结果的聚合评价，判断是否存在与所述成语词库集合匹配的成语聚合结果；判断结果处理单元，用于当所述多层级分割结果中存在所述成语聚合结果时，则保留所述成语聚合结果，并在将所述多层级分割结果中所述成语聚合结果部分的其他分割结果剔除。4.根据权利要求1所述的系统，其特征在于，所述系统还包括：词汇特征获得单元，用于构建发言识别词汇特征集合，并...

【专利技术属性】
技术研发人员：宋永生，王楠，
申请(专利权)人：文灵科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人