欢迎来到杂志之家!发表咨询:400-888-7501 订阅咨询:400-888-7502 股权代码 102064

大数据审计监督平台应用分析

摘要:响应国家大数据发展战略,增强审计机关在大数据环境下查错纠弊、规范管理的能力,建设一个大数据审计监督平台十分必要。
大数据审计监督平台应用分析

1引言

党的十八大以来,多次强调要应用大数据提升国家治理现代化水平。为此,各级审计机关都在积极探索如何利用大数据技术加强审计工作,实现将广大审计人员的审计思路、审计判断、审计方法等智慧汇集于一体的智慧审计[1]。本文从技术需求、功能实现和实施效果等方面讨论一个能帮助审计机关实现审计监督智慧化、常态化以及全覆盖,有效突破账本局限,实现足不出户搞审计的大数据审计监督平台的应用实践。

2平台简介

大数据审计监督平台是金审工程的一项建设内容。平台依托政府云平台建设,应用多维分析、关联分析等大数据处理技术搭建审计监督指挥中心、审计数据中心和智慧审计中心三大功能模块。其中,审计监督指挥中心为各级领导掌控宏观情况、指挥工作提供决策支持;审计数据中心以金审工程的行业审计数据规划为基础,通过部署一系列SSIS(MicrosoftSQLServerIntegrationServices)包,对社保、财政等行业业务数据进行自动还原、转换和校验等数据标准化操作,实现数据采集、加工、转换、存储、交换、共享和管理等低端数据整理工作智能化;智慧审计中心是发现审计线索、解决审计问题的直接生产工具,实现将审计专家经验通过SQL(StructuredQueryLanguage)等数据库结构化查询语言固化成审计数据分析模型,一键式生成分析结果,筛选审计疑点,实现科学审计监督,对重点行业审计数据分析提供工具支撑。平台还设置一些常态化的分析任务,实时对不符合逻辑的数据、不符合相关指标的数据、不符合政策的数据,按照预设好的阀值开展自动预警、产生疑点,推进无项目审计的实现,及时控制风险,避免资金重大损失,真正实现了审计关口前移,加强日常审计。

3平台建设方案

3.1技术方案

3.1.1总体技术框架

大数据审计监督平台以审计业务需求为先导,以可靠信息技术为基础,以信息资源共享为依托,以破解数据“采集难”、“保管难”和“整合难”等传统审计中常见的三重困难为目标[2],基于SOA(Service-OrientedArchitecture)应用架构,建设联网审计中心和审计数据中心两大功能中心(总体技术框架见图1)。其中联网实时审计中心包含组织预算执行审计、部门预算执行审计、社保审计。(1)基础设施层:为整个环境运行提供基础支撑环境,包含服务器设备、存储设备、视频会议设备、网络设备、安全设备、数据库环境和操作系统环境。(2)数据层:为应用层提供基础数据支撑,包含原始数据区、行业审计数据区、跨行业审计数据区、交换共享数据区。(3)支撑层:为上层的应用层提供各种工具组件支撑,包含统一权限管理、统一用户管理、单点登录、安全日志、数据挖掘、基础资料维护、审计目录维护、查询分析、报表管理、工作流引擎。(4)应用层:提供了满足行业联网实时审计、审计数据管理、领导决策等一系列应用系统。(5)信息安全和标准规范体系,从理论、设施、应用三个层面,为审计业务开展提供必要保障。(6)系统运维保障体系:建立和完善审计队伍信息化素质培养机制,建立审计信息化专业的运维保障体系为审计信息化良好应用保驾护航。

3.1.2关键技术

(1)数据仓库技术。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合[3]。大数据审计监督平台以现有各行业审计电子数据和审计机关自身管理业务数据的积累为基础建设数据仓库,主要供审计人员的数据分析和领导决策之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留。(2)ETL(Extract-Transform-Load)整合技术。主要用于将被审计单位各业务系统的数据及所需要的数据文件抽取至数据仓库,并进行数据的清洗、转换、加载等操作,形成审计数据分析应用(分行业、分领域)所需的各种数据汇总数据模型、分析模型,最终形成各种报表、查询以及主题分析。(3)联机分析技术OLAP(On-LineAnalyticalProcessing)。以多维度方式分析数据,弹性地提供上钻、下钻、切片和切块、旋转等操作,主要用于大规模数据分析和统计计算[4]。OLAP也可以说是多维数据分析工具的集合,是数据仓库中大容量数据得以有效利用的重要保障。其基本思想是:审计业务人员或审计机关领导应能灵活地操纵各项权限内的数据,以多维的形式从多方面和多角度来观察对象状态和变化。

3.2功能实现

3.2.1数据采集功能

审计项目中采集的各行业系统原始数据兼容性差、异构性强,且原始数据库结构复杂,无法直接在审计中使用,需要进行一定的数据转换。大数据审计监督平台的审计数据中心基于ETL技术,以金审工程的行业审计数据规划为基础,对被审计单位信息系统的原始数据进行数据抽取、数据转换和数据加载(数据处理流程见图2),形成统一标准表,方便审计人员开展数据分析。由于这些行业数据转换程序相对固定,平台则设计将这些转换操作程序化,从而实现利用计算机程序控制这些重复的、低端的数据转换工作,实现数据标准整理的智能化。(1)数据抽取,是从数据源获取所需数据的过程。审计数据中心使用windows自带的bat(Batch)批处理工具,实现对各种常见数据库类型如SqlServer、MySQL和Oracle等的备份文件进行自动还原操作。(2)数据转换,是按照数据源与目标数据的定义(审计署的各类数据规划),将数据传输到目标数据。审计数据中心根据数据规划,为财政、社保等行业数据设计了一系列的SSIS数据转换模板。通过启动ETL服务器上的SSIS数据转换模板,自动完成对还原后的原始数据进行操作,自动执行特定的转换脚本,最终形成审计基础数据、审计分析数据以及多维数据集。(3)数据加载,是将已完成抽取转换的数据加入目标数据库。审计数据中心在完成数据自动采集转换成标准表的基础上,还进一步实现对数据的加工。如联网审计中心的多维数据分析的数据来源就是审计数据中心通过ETL服务器中的SSAS(SQLServerAnalyticServices)转换模板将审计基础数据区的审计标准数据,经过数据加工形成审计多维数据集。

3.2.2数据保管功能

审计数据中心依托数据仓库技术构建了原始数据区、行业审计数据区、跨行业审计数据区和交换共享数据区等数据存储区形成了审计数据仓库,将被审计单位原始审计数据、行业审计数据、审计管理数据进行规范化管理,支撑了联网审计中心、跨行业综合对比分析和数据交换共享等功能。审计数据仓库的建设,是以现有被审计单位大量系统数据和审计机关自身管理业务数据的积累为基础,灵活加载新增的行业数据,并把信息加以整理归纳和重组,及时提供给相应的管理决策人员。数据仓库结构模型如图3所示。审计数据中心不仅通过数据存储分区设计,解决审计电子数据“存”的问题,还通过综合管理平台的用户角色和权限功能,实现根据不同审计项目,不同处室部门、不同用户级别设置可查询的电子数据,解决了审计电子数据“用”的问题。在审计项目开始前,各审计组根据审计需要,向审计数据中心管理处室审前数据查询权限,并由系统管理人员根据领导批示对审计组开放相关权限。在审计项目中,各审计组将审计项目中采集到的被审单位的原始电子数据,移交给审计数据中心管理处室,办理移交手续。系统管理员将原始电子数据存放到原始数据区,启动审计数据中心的数据自动采集转换功能,将原始电子数据经过抽取、清洗转换后加载到数据仓库中的行业审计数据区。

3.2.3数据整合功能

目前,机关里普遍存在计算机技术和审计业务应用两张皮现象,一些资深干部提升计算机水平难、一些年轻干部掌握业务经验少,导致各行业审计电子数据无法整合使用。为解决这一问题,联网审计中心通过设计“审计模型”的功能,将审计人员的审计经验固化。审计人员通过图形化构建界面灵活搭建出各种审计模型,及时将审计思路固化。审计人员在进行同类问题审计时,只需点击运行,就能迅速将同类问题一网打尽,有效解决审计问题个案化和审计成果碎片化的问题,转变以往计算机审计的“精英路线”为“群众路线”。同时,将大数据审计和传统审计相结合。面对大数据分析产生的批量分析结果,审计人员要结合账本凭证和有关业务资料进行比对印证[5]。

(1)构建查询类数据分析模型。在实际工作中,审计人员根据法律、法规和制度规定的状态和关系、业务的逻辑关系、不同类型数据之间的对应关系以及审计人员的合理预测等建立审计查询分析模型。如在二次分配资金下达情况审计事项分析中,审计人员对所有二次分配项目资金进行查询,筛选出超时限下达的情况,从而揭示出二次分配资金沿用惯性做法,未提早谋划具体的项目,影响资金使用的绩效问题。步骤一,利用重算分析,对单位层指标数据,按照与财政部门相同的数据处理方法重新计算各时点发展性项目实际分配下达到具体单位、项目和资金情况。步骤二,利用检查分析,对这些重算后的分析数据进行条件查询,筛选出所有不按政策“6月份前下达60%,9月份前下达100%”要求的项目的执行情况,从而检查所有项目二次分配情况,筛查出不及时下达项目的详细情况。

(2)构建多维度数据分析模型。多维分析模型是将数据立方中的维度与度量值经过组合,呈现给用户多角度、多层次的分析结果。联网审计中心提供图形化的多维分析模型构建界面,审计人员按照设定好的分析思路,通过拖放选取度量和维度,轻松完成个性化的多维模型建立,也能为多维分析模型增加多个分析步骤,改进系统预设分析模型。例如,在套取医保基金的问题审计中,审计人员利用联网审计中心的多维分析模型对医保结算数据进行多维分析。步骤一,审计人员先从开药量维度入手,筛查出医保统筹结算金额在全市排名前50的参保人员。步骤二,再从就诊次数维度,筛查出医保统筹医保统筹结算金额在全市排名前50的参保人员的就诊次数和就诊的医疗机构数量。步骤三,结合开药量和就诊次数两个维度的结果,并根据收集的药品使用说明数并结合医生指导,分析出以上疑点数据人员同类药品总量,锁定疑点人员。

(3)构建穿透式数据分析模型。审计人员在“关联”模块设置关联模型、关联模型参数等参数建立模型间的关联关系,从而实现模型彼此之间的关联与穿透,将整个审计数据由“点”成“链”,通过对各个行业数据汇总、整合和分析,进而逐步实现审计数据由“链”成“网”。例如在开展部门预算执行审计项目时,审计人员通过联网审计中心构建财政指标数据穿透模型,对财政指标系统的总指标、处室指标和单位指标三层指标通过指标流进行关联,实现点击单位指标,可查看其处室指标,点击处室指标可关联到总指标,实现了财政指标数据的全关联。

4平台实施效果

该系统建成以来,初步实现了对大数据的分析应用,有效解决了传统审计无法克服的困难,提升了审计效率,全力推进审计监督全覆盖,切实为经济高质量发展落实赶超提供审计监督服务保障。

(1)审计覆盖面更广。依托大数据审计监督平台,强力推进“集中分析、发现疑点、分散核查、系统研究”的数字化审计工作模式,有效提升审计监督效能。如,近年的“同级审”工作中,在全省率先采集了全部市直部门单位财政财务数据,开发固化52个通用和个性化数据分析模型。从资金流维度和时间维度,通过纵向比较,打通市、县财政业务数据“孤岛”通道,明晰财政数据、业务数据间的关系,贯穿多年财政业务数据间的关联。

(2)审计查核问题更准。通过平台对不同来源的数据经过有效关联、融合,形成针对某个领域、某个对象的完整视图,帮助审计人员发现隐含的关联关系、理清事件的来龙去脉,辅助审计决策,使得已经发生的不规范问题难以循形。如在某扶贫资金跟踪审计中,通过将扶贫系统数据与房产车辆、工商注册和医疗等多部门数据比对分析,对建档立卡人员及家庭的市造福工程、农村危房改造和重特大医疗救助等21项扶贫涉农资金数据进行分析,筛选出疑点数据3000多条,查出违规改变项目资金用途、资金不到位不落实及资金滞留闲置等主要问题。

参考文献

[1]王开一.大数据环境下的智慧审计构想.中国审计,2018(15):23-25

[2]齐春丽.加强大数据审计推进数字化发展.中国审计,2018(3):53-54

[3]袁汉宁.数据仓库与数据挖掘.北京:人民邮电出版社出版,2015

[4]尚硅谷IT教育.大数据分析:数据仓库项目实战.北京:电子工业出版社,2020

[5]冯拓.基层审计机关推进审计全覆盖的路径探析,中国审计,2021(16):56-57

作者:刘殷星 单位:福州市政府固定资产投资审计中心

在线咨询