基于神经网络的工程标准规范获取方法及系统技术方案

技术编号:39815648 阅读:4 留言:0更新日期:2023-12-22 19:34
本发明专利技术公开了一种基于神经网络的工程标准规范获取方法及系统,该方法包括:获取目标用户输入的原始数据;根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据;将所述处理后数据输入至训练好的

【技术实现步骤摘要】
基于神经网络的工程标准规范获取方法及系统


[0001]本专利技术涉及数据处理
,尤其涉及一种基于神经网络的工程标准规范获取方法及系统


技术介绍

[0002]随着工程项目的规模和复杂度的增加,对于工程项目进行合规检查和监控的难度和成本也越来越大,许多企业开始试图引入更加先进的信息技术来提高工程合规监控审查的效率,其中,如何及时搞笑地获取或更新工程标准规范成为了其中重要的一个问题

但现有的信息技术在解决工程标准规范的获取方面的工作任务时,过于依赖人工检索和检验,没有考虑到结合神经网络算法的优势,因此容易出错,效率较低

可见,现有技术存在缺陷,亟需解决


技术实现思路

[0003]本专利技术所要解决的技术问题在于,提供一种基于神经网络的工程标准规范获取方法及系统,能够提高工程标准规范数据的获取效率和精确性,相对于现有技术中依赖人工的方式,可以有效减少出错,使得工程建设合法合规

[0004]为了解决上述技术问题,本专利技术第一方面公开了一种基于神经网络的工程标准规范获取方法,所述方法包括:
[0005]获取目标用户输入的原始数据;
[0006]根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据;
[0007]将所述处理后数据输入至训练好的
GPT
神经网络模型中,以得到输出的工程标准规范数据;
[0008]将所述工程标准规范数据推送至用户终端

[0009]作为一种可选的实施方式,在本专利技术第一方面中,所述根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据,包括:
[0010]将语音类型的所述原始数据输入至语音识别算法模型中,以得到文本类型的处理后数据;所述语音识别算法模型为百度语音识别模型或腾讯
AI
开放平台
API
对应的算法模型

[0011]作为一种可选的实施方式,在本专利技术第一方面中,所述
GPT
神经网络模型包括依次连接的文本预处理模型
、GPT
概率推测模型和文本片段组合模型

[0012]作为一种可选的实施方式,在本专利技术第一方面中,所述文本预处理模型用于执行以下步骤:
[0013]根据预设的语言结构分析模型,对所述处理后数据进行分析,得到所述处理后数据中每一数据片段对应的语言结构类型;所述语言结构类型包括主语

谓语

宾语

定语

名词

动词

形容词中的一种或多种的组合;
[0014]根据预设的工程规范关键字库,对所述处理后数据进行关键字识别,以得到所述
处理后数据中的多个关键字片段;
[0015]确定每一所述关键字片段对应的语言结构类型;
[0016]根据预设的类型

权重对应关系,计算每一所述关键字片段对应的语言结构类型对应的类型权重;
[0017]计算每一所述关键字片段与对应的匹配关键字之间的相似度;所述匹配关键字为所述工程规范关键库中用于识别出所述关键字片段的匹配字符;
[0018]计算每一所述关键字片段的所述类型权重和所述相似度的乘积,得到每一所述关键字片段对应的文本权重;
[0019]将所述文本权重大于预设的权重阈值的所有所述关键字片段确定为所述处理后数据对应的待预测片段

[0020]作为一种可选的实施方式,在本专利技术第一方面中,所述
GPT
概率推测模型用于对每一所述待预测片段和对应的语言结构类型进行概率预测,以得到每一所述待预测片段对应的属于工程标准规范数据的数据类型的概率;所述
GPT
概率推测模型通过包括有多个训练文本片段和对应的语言结构类型标注和数据类型标注的训练数据集训练得到;所述数据类型包括工程标准规范名称

工程标准规范制定方

工程标准规范文字条件

工程标准规范数字条件

工程标准规范针对方中的至少一种

[0021]作为一种可选的实施方式,在本专利技术第一方面中,所述文本片段组合模型包括文本筛选单元

文本拼接单元

文本连贯性预测单元和文本输出单元;所述文本筛选单元用于将所述概率大于预设的概率阈值的所述待预测片段筛选出来,得到多个待拼接片段;所述文本拼接单元用于对所述多个待拼接片段根据多种拼接规则进行组合拼接,以得到多个拼接片段;所述文本连贯性预测单元用于对每一所述拼接片段进行连贯性预测,以得到每一所述拼接片段的连贯性参数;所述文本输出单元将所述连贯性参数大于预设的参数阈值的所述拼接片段进行输出,以得到所述工程标准规范数据

[0022]作为一种可选的实施方式,在本专利技术第一方面中,所述文本拼接单元用于执行以下步骤:
[0023]对于以任意次序连接的任意两个所述待拼接片段,对该两个待拼接片段的连接处对应的预设数量个字符,通过文本连贯性预测模型进行预测,得到该两个待拼接片段的对应的第一连贯性参数;所述文本连贯性预测模型通过包括有多个训练工程文本连接字符片段和对应的连贯性批注的训练数据集训练得到;
[0024]对该两个待拼接片段对应的所述语言结构类型,通过预设的语言结构连贯性规则进行判断,得到该两个待拼接片段对应的第二连贯性参数;
[0025]计算所述第一连贯性参数和所述第二连贯性参数的加权求和平均值,并判断所述加权求和平均值是否大于预设的连贯性阈值,若是,则输出该两个待拼接片段按该次序的组合为一个拼接片段

[0026]本专利技术第二方面公开了一种基于神经网络的工程标准规范获取系统,所述系统包括:
[0027]获取模块,用于获取目标用户输入的原始数据;
[0028]处理模块,用于根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据;
[0029]输出模块,用于将所述处理后数据输入至训练好的
GPT
神经网络模型中,以得到输出的工程标准规范数据;
[0030]推送模块,用于将所述工程标准规范数据推送至用户终端

[0031]作为一种可选的实施方式,在本专利技术第二方面中,所述处理模块根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据的具体方式,包括:
[0032]将语音类型的所述原始数据输入至语音识别算法模型中,以得到文本类型的处理后数据;所述语音识别算法模型为百度语音识别模型或腾讯
AI
开放平台
API
对应的算法模型

[0033]作为一种可选的实施方式,在本专利技术第二方面中,所述
GPT
神经网络模型包括依次连接的文本预处理模型
、GPT...

【技术保护点】

【技术特征摘要】
1.
一种基于神经网络的工程标准规范获取方法,其特征在于,所述方法包括:获取目标用户输入的原始数据;根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据;将所述处理后数据输入至训练好的
GPT
神经网络模型中,以得到输出的工程标准规范数据;将所述工程标准规范数据推送至用户终端
。2.
根据权利要求1所述的基于神经网络的工程标准规范获取方法,其特征在于,所述根据预设的数据预处理算法对所述原始数据进行处理,得到处理后数据,包括:将语音类型的所述原始数据输入至语音识别算法模型中,以得到文本类型的处理后数据;所述语音识别算法模型为百度语音识别模型或腾讯
AI
开放平台
API
对应的算法模型
。3.
根据权利要求1所述的基于神经网络的工程标准规范获取方法,其特征在于,所述
GPT
神经网络模型包括依次连接的文本预处理模型
、GPT
概率推测模型和文本片段组合模型
。4.
根据权利要求3所述的基于神经网络的工程标准规范获取方法,其特征在于,所述文本预处理模型用于执行以下步骤:根据预设的语言结构分析模型,对所述处理后数据进行分析,得到所述处理后数据中每一数据片段对应的语言结构类型;所述语言结构类型包括主语

谓语

宾语

定语

名词

动词

形容词中的一种或多种的组合;根据预设的工程规范关键字库,对所述处理后数据进行关键字识别,以得到所述处理后数据中的多个关键字片段;确定每一所述关键字片段对应的语言结构类型;根据预设的类型

权重对应关系,计算每一所述关键字片段对应的语言结构类型对应的类型权重;计算每一所述关键字片段与对应的匹配关键字之间的相似度;所述匹配关键字为所述工程规范关键库中用于识别出所述关键字片段的匹配字符;计算每一所述关键字片段的所述类型权重和所述相似度的乘积,得到每一所述关键字片段对应的文本权重;将所述文本权重大于预设的权重阈值的所有所述关键字片段确定为所述处理后数据对应的待预测片段
。5.
根据权利要求3所述的基于神经网络的工程标准规范获取方法,其特征在于,所述
GPT
概率推测模型用于对每一所述待预测片段和对应的语言结构类型进行概率预测,以得到每一所述待预测片段对应的属于工程标准规范数据的数据类型的概率;所述
GPT
概率推测模型通过包括有多个训练文本片段和对应的语言结构类型标注和数据类型标注的训练数据集训练得到;所述数据类型包括工...

【专利技术属性】
技术研发人员:聂琪
申请(专利权)人:广东筑小宝人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1