【技术实现步骤摘要】
数据检测方法及相关装置
[0001]本申请涉及信息处理
,具体涉及一种数据检测方法及相关装置。
技术介绍
[0002]金融数据涉及金融领域的股票数据、期权数据、期货数据和客户信息等多个方面,随着经济发展,金融数据的数据量日益增加。对于证券公司而言,对如此庞大体量的数据进行管理和维护,必然不是单个人能够承接的,需要系统与流程支持数据治理工作的开展。而在多个人或多个团队对大量数据进行操作的场景中,由于每个人或每个团队对金融数据进行管理所使用的工具和标准不同,缺乏统一的数据标准,难以保证制定的数据标准可以切实落地在金融系统中,在对大量金融数据进行统一处理时容易出现错误,影响数据处理效率。
技术实现思路
[0003]本申请实施例提供了一种数据检测方法及相关装置,有助于确保待检测数据的规范和统一,并有助于提高后续处理过程中对金融数据的处理效率。
[0004]第一方面,本申请实施例提供一种数据检测方法,应用于证券公司综合服务系统中的数据整合服务器,所述证券公司综合服务系统包括数据采集服务器和所述数据整合服务器,所述数据采集服务器和所述数据整合服务器通信连接;所述方法包括:获取所述数据采集服务器中的至少一个待检测数据,待检测数据用于指示第一用户提交和/或指定的金融数据脚本,所述待检测数据包括目标字段,所述目标字段用于表征所述第一用户对所述待检测数据在所述金融数据脚本中的定义信息;对每一待检测数据进行解析,得到所述每一待检测数据的解析结果;根据预设的检测规则对所述解析结果进行检测,得到第一检测结果;使用 ...
【技术保护点】
【技术特征摘要】
1.一种数据检测方法,其特征在于,应用于证券公司综合服务系统中的数据整合服务器,所述证券公司综合服务系统包括数据采集服务器和所述数据整合服务器,所述数据采集服务器和所述数据整合服务器通信连接;所述方法包括:获取所述数据采集服务器中的至少一个待检测数据,待检测数据用于指示第一用户提交和/或指定的金融数据脚本,所述待检测数据包括目标字段,所述目标字段用于表征所述第一用户对所述待检测数据在所述金融数据脚本中的定义信息;对每一待检测数据进行解析,得到所述每一待检测数据的解析结果;根据预设的检测规则对所述解析结果进行检测,得到第一检测结果;使用预设的数据标准库对所述解析结果中的所述目标字段进行检测,得到第二检测结果;在所述第一检测结果和/或所述第二检测结果指示所述待检测数据存在错误的情况下,生成对应的告警信息;向第二用户发送所述对应的告警信息。2.根据权利要求1所述的方法,其特征在于,所述使用预设的数据标准库对所述解析结果中的所述目标字段进行检测,得到第二检测结果,包括:对所述目标字段进行分词,得到所述目标字段对应的至少一种分词结果,每一种分词结果中包括至少一个字词;对所述每一种分词结果执行如下步骤A
‑
B,得到至少一个分词准确率,每一种分词结果对应一个分词准确率:步骤A:确定当前处理的分词结果中的每一个字词在预设的文本库中出现的频率,所述当前处理的分词结果中的每一个字词在预设的文本库中出现的频率为第一词频,所述第一词频为至少一个;步骤B:对至少一个第一词频进行计算,得到所述当前处理的分词结果的分词准确率;确定所述至少一个分词准确率中的最高值,以及所述至少一个分词准确率中的最高值对应的分词结果,所述至少一个分词准确率中的最高值对应的分词结果为目标分词结果;使用预设的数据标准库对所述目标分词结果进行检测,得到第二检测结果。3.根据权利要求2所述的方法,其特征在于,若所述预设的文本库中不存在所述当前处理的分词结果中的字词,所述确定当前处理的分词结果中的每一个字词在预设的文本库中出现的频率,包括:将第一字词对应的词频确定为第二词频,所述第一字词为所述预设的文本库中不存在的字词。4.根据权利要求3所述的方法,其特征在于,在将第一字词对应的词频确定为第二词频之后,所述方法还包括:通过隐马尔科夫模型对所述第一字词进行处理,得到再分词结果,所述再分词结果中包括至少一个字词;将所述再分词结果中的至少一个字词收录于所述预设的文本库中;更新所述再分词结果中的至少一个字词的词频。5.根据权利要求2所述的方法,其特征在于,所述预设的数据标准库中包括至少一个标准字词,每一标准字词对应一个定义字段,所述使用预设的数据标准库对所述目标分词结
果进行检测,得到第二检测结果,包括:在所述目标分词结果对应的字词中选取至少一个目标字词,所述至少一个目标字词用于表征所述定义信息中的关键信息;对每一目标字词执行如下步骤C
‑
D:步骤C:确定当前处理的目标字词在所述目标字段中的TF
‑
IDF值,所述当前处理的目标字词在所述目标字段中的TF
‑
IDF值为第一TF
‑
IDF值,所述第一TF
‑
IDF值构成第一向量;步骤D:确定所述当前处理的目标字词在所述每一标准字词的定义字段中的TF
‑
IDF值,所述当前处理的目标字词在所述每一标准字词的定义字...
【专利技术属性】
技术研发人员:李家耀,司东华,宋鹏程,胡冬伟,刘奥,黄康乔,
申请(专利权)人:中国中金财富证券有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。