基于时空规则的差旅报销异常行为检测方法和系统技术方案

技术编号:33995764 阅读:37 留言:0更新日期:2022-07-02 10:50
本发明专利技术提供一种基于时空规则的差旅报销异常行为检测方法及系统,即从报销人员提供的报销凭证及差旅活动文字摘要中提取差旅活动要素;构建基于时空特性的异常行为检测规则;设置异常行为检索引擎;利用检索引擎,对差旅报销凭证进行检测分析,发现是否存在异常行为。另外,该方法还通过从报销人员提供的报销凭证及差旅活动文字摘要中提取的差旅活动要素,生成报销人员基于时空特性的可视化活动轨迹,通过对其可视化活动轨迹的路线、活动场景的时间、地点的分析,检测是否存在异常行为。本发明专利技术有效地避免财务风险,并大幅提高财务人员审核效率及准确率。审核效率及准确率。审核效率及准确率。

【技术实现步骤摘要】
基于时空规则的差旅报销异常行为检测方法和系统


[0001]本专利技术涉及一种基于时空规则进行数据分析的方法及系统,具体地说,本专利技术涉及一种基于时空规则对差旅报销异常行为进行检测和分析的方法及系统。本专利技术属于数据分析


技术介绍

[0002]差旅报销是指对出差旅途中产生的交通费、住宿费、餐饮费及其他支出费用的报销,是企事业单位一项重要的经常性支出项目。通常,报销人员在其差旅活动结束后,将相关原始票据及整个差旅活动的文字说明一并提交给财务人员,财务人员针对差旅活动中产生的票据的真实性、合法合规性和合理性进行人工审核,在判断无违规行为情况审核通过后,进行付款,最终完成整个差旅报销事项。
[0003]这种差旅报销过程的缺点是:存在一定的财务风险。由于整个报销过程主要以人工审核为主,现有的报销票据多数表现为纸质票据以及可重复打印的电子发票等非结构化数据,难以建立起有效的数据关联机制、无法查看报销人员的出差轨迹、无法综合分析利用历史差旅报销情况,另一方面,报销人员可通过拆分报销或者重复报销等手段构建出合理的差旅活动,以躲避常规的财务本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于时空规则的差旅报销异常行为检测方法,其特征在于:该方法从报销人员提供的报销凭证及差旅活动文字摘要中提取差旅活动要素;构建基于时空特性的异常行为检测规则;设置异常行为检索引擎;利用检索引擎,对差旅报销凭证进行检测分析,发现是否存在异常行为。2.根据权利要求1所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:它还包括通过从报销人员提供的报销凭证及差旅活动文字摘要中提取的差旅活动要素,生成报销人员基于时空特性的可视化活动轨迹,通过对其可视化活动轨迹的路线、活动场景的时间、地点的分析,检测是否存在异常行为。3.根据权利要求2所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:所述差旅活动要素是通过文本摘要正则表达式和OCR识别技术从报销凭证中提取。4.根据权利要求3所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:通过OCR图像识别技术将各种纸质的票据转换成图像,抽取其中的文字信息和图像栅格位置信息,基于栅格定位方法,在票据模板底板上按照栅格位置匹配还原,获取具有语义含义的差旅要素。5.根据权利要求3所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:通过OCR识别技术和扫描仪批量扫描表单、票据数据,采集原始数据;将采集到的原始数据与票据识别模版进行比对,选择匹配的模版;对数据进行预处理、分类,提取具有语义含义的差旅活动要素。6.根据权利要求3所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:通过TextRank算法自动从提交的文本文件中提取摘要信息,并按照机器可解析的格式形成一小段文字,展示差旅活动内容,然后再通过正则表达式解析提取出差旅活动要素;具体方法是:先对所选片段信息进行分析,搜索出符合所需的文档;取PageRank值较大的前M个差旅活动内容,对每个内容进行自动文本摘要生成;进行文本分句、句子分词和去掉停用词、映射词向量预处理操作,计算句子间的共现词的出现次数作为句子间的相似度,然后建立句子间相似度矩阵;相似度矩阵值使用TextRank算法迭代计算,直到迭代计算结果收敛,再对所有句子的权重降序排列,抽取出前N个句子组成自动摘要内容作为结果输出;对每个文档都做处理,再做文本摘要生成,得到所需的差旅活动摘要;获取得到差旅活动摘要内容后,通过正则表达式提取相关差旅活动要素。7.根据权利要求4~6之一所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:构建基于时空特性的异常行为检测规则包括如下步骤:构建基于时间特性的异常行为检测规则,时间特性规则分为预设规则和动态组合规则,预设规则包括:1)同一时间段内分属不同活动规则;2)节假日活动规则;3)非工作时间段活动规则;动态组合规则是将差旅活动要素中的各时间要素进行组合比较;构建基于时空特性的异常行为检测规则,包括但不限于:1)同一空间的时间连续活动规则;2)同一空间的时间不连续活动规则;3)不同空间的连续活动规则;4)不同空间的不连续活动规则;5)时间和空间的符合性要求规则。8.根据权利要求7所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:设
定执行检测规则的条件,依据构建的异常行为检测规则对差旅活动进行检测分析和判断的方法为:1)设定差旅活动的空间要素和时间要素;2)设定交通工具种类、出发地、目的地、出发时间、达到时间;3)不同空间、不同交通工具转移概率计算;4)计算出发地、中途地、目的地之间是否存在线路绕行情况;5)依据构建的基于时空特性的异常行为检测规则,判断是否存在异常用户行为。9.根据权利要求8所述的基于时空规则的差旅报销异常行为检测方法,其特征在于:将报销人员差旅活动的空间位置通过经纬度转换服务转换为经纬度信息,同时将其活动轨迹按照时间顺序以及乘坐的交通工具在地图中进行可视化展示,生...

【专利技术属性】
技术研发人员:施卓敏刘春雨于建军
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1