一种针对药品文档内容的智能分析方法、系统和存储介质技术方案

技术编号:25837060 阅读:33 留言:0更新日期:2020-10-02 14:17
本发明专利技术公开了一种针对药品文档内容的智能分析方法,包括分别获取待分析的第一表格和第二表格内的单元格坐标和内容,识别内容一致单元格;分别获取第一表格和第二表格的最小表格矩阵;根据两表格的最小表格矩阵间差异与在对应表格中的位置,获取异常单元格组;将异常单元格组中内容不一致单元格的内容进行对比,找出并标记单元格内容中不一致的字符集合。最终减少呈现给用户的不一致单元格结果数量,便于用户快速排查发现错误、异常表格。

【技术实现步骤摘要】
一种针对药品文档内容的智能分析方法、系统和存储介质
本专利技术涉及数据处理和分析
,尤其涉及一种针对药品文档内容的智能分析方法、系统和存储介质。
技术介绍
电子表格(Spreadsheet),又称电子数据表,由一系列行与列构成的网格,网格内可以存放数值、计算式以及文本等。常用的电子表格例如Excel表格,Excel表格被提交至版本管理服务器做版本管理。在日常的一些领域的文字处理工作中,经常需要处理大量的文档,而这些文档中又存在大量表格,这些表格具有相似度高,相互引用、嵌套的情况,同时由于处理工作量大等原因,经常需要多个用户协作进行文档编辑。例如,药企研发机构在准备整理药品申报资料时存在大量文档,文档中存在大量表格。这些表格存在相似度高、相互引用、和嵌套等各类情况。同时,由于这些关联表格由多人人为整理,往往存在对应单元格内容不一致、表格行列丢失、表格行列顺序错乱等各种错误情况。但是由于表格众多,而其分布在大量不同文档中,这就造成后期人为检查的工作量极大,且上述错误情况难以发现,最终直接导致资料错误,合规性需求难以满足,严重拖延了药品申报进度本文档来自技高网...

【技术保护点】
1.一种针对药品文档内容的智能分析方法,用于对文档内的表格内容差异进行分析,其特征在于,包括:/nS1,分别获取待分析的第一表格和第二表格内的单元格坐标和内容,识别内容一致单元格;/nS2,分别获取第一表格和第二表格的最小表格矩阵,所述最小表格矩阵为包含表格内所有内容一致单元格的最小矩形表格区域;/nS3,根据两表格的最小表格矩阵间差异与在对应表格中的位置,获取异常单元格组,所述异常单元格组包括但不限于内容不一致单元格坐标和内容;/nS4,将异常单元格组中内容不一致单元格的内容进行对比,找出并标记单元格内容中不一致的字符集合。/n

【技术特征摘要】
1.一种针对药品文档内容的智能分析方法,用于对文档内的表格内容差异进行分析,其特征在于,包括:
S1,分别获取待分析的第一表格和第二表格内的单元格坐标和内容,识别内容一致单元格;
S2,分别获取第一表格和第二表格的最小表格矩阵,所述最小表格矩阵为包含表格内所有内容一致单元格的最小矩形表格区域;
S3,根据两表格的最小表格矩阵间差异与在对应表格中的位置,获取异常单元格组,所述异常单元格组包括但不限于内容不一致单元格坐标和内容;
S4,将异常单元格组中内容不一致单元格的内容进行对比,找出并标记单元格内容中不一致的字符集合。


2.根据权利要求1所述的针对药品文档内容的智能分析方法,其特征在于,所述步骤S3具体包括:
S31,分别获取所述第一表格和第二表格的行数和列数;
S32,当所述第一表格与第二表格的行数或列数差值小于预设值时,根据两表格的最小表格矩阵间差异与在对应表格中的位置来获取所述异常单元格组,否则不进行后续差异分析。


3.根据权利要求2所述的针对药品文档内容的智能分析方法,其特征在于,在所述第一表格与第二表格的行数或列数差值小于预设值时,所述步骤S32包括:
S101,当两表格最小表格矩阵的行列数一致时,遍历最小表格矩阵的每一单元格;
S102,比较两最小表格矩阵对应位置的内容是否相等,若相等则不记录所述异常单元格组,否则记录异常单元格组。


4.根据权利要求3所述的针对药品文档内容的智能分析方法,其特征在于,在所述第一表格与第二表格的行数或列数差值小于预设值时,所述步骤S32还包括:
S103,若最小表格矩阵的行数和列数相同,则将第一表格转置形成第一转置表格;
S104,将第二表格的最小表格矩阵与所述第一转置表格的最小表格矩阵进行比较并识别内容不一致单元格;
S105,如果不存在内容不一致单元格则不进行后续差异分析,否则生成第二异常单元格组,所述第二异常单元格组包括但不限于第一转置表格最小表格矩阵和第二表格最小表格矩阵间内容不一致单元格坐标和...

【专利技术属性】
技术研发人员:葛亚飞王立君林加旗魏巍包卿
申请(专利权)人:浙江明度智控科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1