一种检测数据的处理方法和装置制造方法及图纸

技术编号：15262690 阅读：209 留言：0更新日期：2017-05-03 18:36

本公开涉及一种检测数据的处理方法和装置，该方法包括：采集预设时间段内多个检测数据样本，对该多个检测数据样本进行预处理得到多个文本字符样本，并建立每个文本字符样本的字符索引图，根据建立的字符索引图获取多个文本字符样本的匹配文本集，其中，该匹配文本集包括在该多个文本字符样本中每两个文本字符样本中都存在的文本字符，然后根据该匹配文本集建立文本特征矩阵，并通过该文本特征矩阵对自组织神经网络进行训练，得到训练模型，最后获取当前检测数据，并通过该训练模型得到当前检测结果，从而提高检测结果判断的准确性。

Processing method and device for detecting data

The present invention relates to a method and device for processing test data, the method comprises: collecting a preset period of time, a plurality of detection data of the plurality of detection data samples were pretreated by multiple text samples, character index charts and established each text character sample, according to the character index chart is established to obtain more a text sample text matching sets, among them, the text set, including all exist in the plurality of text characters in the sample every two characters of text sample text characters, then according to the text, the set of text feature matrix, and the training of self organizing neural network through the text feature matrix and get the training model, finally get the current test data, and get the test results through the training model, so as to improve the accuracy of judging test results.

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据处理领域，具体地，涉及一种检测数据的处理方法和装置。
技术介绍
随着信息时代数据量的爆炸式增长，检测数据也展现出容量大、增速快、形式多样和潜在价值高等特点，并且检测数据的载体已经由传统纸质转变为电子文本，因此对这些检测数据进行数据挖掘显得尤为重要，通过数据挖掘技术可以对检测数据进行分析。在医疗数据处理过程中，医务人员通常以患者对病状的描述、观察症状和检查结果对患者的病情进行判断，因而判断的准确性主要依赖于医务人员的个人经验和专业素质，由于医务人员的经验有限，因此对患者的病情的判断可能会存在偏差，导致判断结果不准确。
技术实现思路
本公开的目的是提供一种检测数据的处理方法和装置，能够提高根据检测数据得到的检测结果的准确性。为了实现上述目的，本公开提供一种检测数据的处理方法，应用于数据处理设备，所述方法包括采集预设时间段内多个检测数据样本，并对所述多个检测数据样本进行预处理得到多个文本字符样本，其中，所述文本字符样本包括文本字符和所述文本字符对应的检测结果的文本字符；建立每个文本字符样本的字符索引图，其中，所述字符索引图包括所述文本字符和字符路径；其中，所述字符路径指示所述文本字符对应的检测结果的文本字符；根据建立的字符索引图获取所述多个文本字符样本的匹配文本集，其中，所述匹配文本集包括在所述多个文本字符样本中每两个文本字符样本中都存在的文本字符；根据所述匹配文本集建立文本特征矩阵，并通过所述文本特征矩阵对自组织神经网络进行训练，得到训练模型；获取当前检测数据，并通过所述训练模型得到当前检测结果。可选地，所述对所述多个检测数据样本进行预处理得到多个...

【技术保护点】
一种检测数据的处理方法，其特征在于，应用于数据处理设备，包括：采集预设时间段内多个检测数据样本，并对所述多个检测数据样本进行预处理得到多个文本字符样本，其中，所述文本字符样本包括文本字符和所述文本字符对应的检测结果的文本字符；建立每个文本字符样本的字符索引图，其中，所述字符索引图包括所述文本字符和字符路径；其中，所述字符路径指示所述文本字符对应的检测结果的文本字符；根据建立的字符索引图获取所述多个文本字符样本的匹配文本集，其中，所述匹配文本集包括在所述多个文本字符样本中每两个文本字符样本中都存在的文本字符；根据所述匹配文本集建立文本特征矩阵，并通过所述文本特征矩阵对自组织神经网络进行训练，得到训练模型；获取当前检测数据，并通过所述训练模型得到当前检测结果。

【技术特征摘要】
1.一种检测数据的处理方法，其特征在于，应用于数据处理设备，包括：采集预设时间段内多个检测数据样本，并对所述多个检测数据样本进行预处理得到多个文本字符样本，其中，所述文本字符样本包括文本字符和所述文本字符对应的检测结果的文本字符；建立每个文本字符样本的字符索引图，其中，所述字符索引图包括所述文本字符和字符路径；其中，所述字符路径指示所述文本字符对应的检测结果的文本字符；根据建立的字符索引图获取所述多个文本字符样本的匹配文本集，其中，所述匹配文本集包括在所述多个文本字符样本中每两个文本字符样本中都存在的文本字符；根据所述匹配文本集建立文本特征矩阵，并通过所述文本特征矩阵对自组织神经网络进行训练，得到训练模型；获取当前检测数据，并通过所述训练模型得到当前检测结果。2.根据权利要求1所述的方法，其特征在于，所述对所述多个检测数据样本进行预处理得到多个文本字符样本，包括：获取所述检测数据样本的文本特征；通过将所述文本特征进行编码处理得到文本字符样本。3.根据权利要求1所述的方法，其特征在于，所述根据建立的字符索引图获取所述多个文本字符样本的匹配文本集，包括：根据所述字符索引图获取所述多个文本字符样本中每两个文本字符样本中都存在的文本字符，得到多个文本字符集；根据所述多个文本字符集组成所述匹配文本集，其中，所述匹配文本集中的文本字符各不相同。4.根据权利要求1所述的方法，其特征在于，所述根据所述匹配文本集构建文本特征矩阵，包括：获取所述匹配文本集中每个文本字符在每个文本字符样本中出现的次数；根据所述匹配文本集中每个文本字符在每个文本字符样本中出现的次数构建所述每个文本字符样本的文本向量；根据所述检测结果相同的文本字符样本的文本向量构建文本特征矩阵。5.根据权利要求1所述的方法，其特征在于，所述通过所述文本特征矩阵对自组织神经网络模型进行训练，得到训练模型，包括：将所述文本特征矩阵进行奇异值分解，得到所述检测结果相同的文本字符样本对应的特征向量；通过所述特征向量对自组织神经网络模型进行训练，得到训练模型。6.根据权利要求5所述的方法，其特征在于，所述通过所述特征向量对自组织神经网络模型进行训练，得到训练模型，包括：获取所述自组织神经网络中获胜的神经元的邻域函数和学习率函数；将所述特征向量和所述自组织神经网络中的神经元对应的多个权向量分别进行归一化处...

【专利技术属性】
技术研发人员：黄亦谦，
申请(专利权)人：北京千安哲信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人