对信息共享和数据仓库审计模式的探析
曹晟 雷应轩(审计署成都办)
【发布时间:2012年03月16日】
字号:【大】 【中】 【小】
随着信息技术及产业的高速发展,审计在信息化方面实施了很多创新性的工作,取得了很好的效果。但在信息的有效利用上还有很多需要转变审计方式,创新审计方法的地方。笔者在本文中主要针对审计信息共享平台的建立和运用上存在的问题提出了建立数据仓库审计模式的建议。

一、信息有效利用方面存在的问题

(一)信息利用法律基础薄弱,需要健全相关法律法规体系。

《审计法》规定,审计机关进行审计时,有权检查被审计单位的会计凭证、会计账簿、财务会计报告和运用电子计算机管理财政收支、财务收支电子数据的系统,以及其他与财政收支、财务收支有关的资料和资产,被审计单位不得拒绝。但是,对于被审计单位数据的长期存储利用范围,审计期间利用被审计单位以外的其他部门的数据权限等内容,没有法律法规进行明确。各部门出于自身利益或安全因素考虑,也不愿主动将数据进行共享,形成了一个个信息孤岛,致使审计采集多部门数据没有法律基础,难以利用外部数据开展工作。现代审计的发展,需要在新的审计模式探索基础上,完善法律法规,促进审计技术方法的转变。

(二)信息共享平台模式单一,需要多方式同步试点。

目前,审计署建立了国家审计数据中心,开始逐步采集各部门和行业数据,希望通过数据规划、数据集中指导未来的审计工作。但是信息共享模式多样,各有优势和劣势,仅仅依靠国家审计数据中心实现信息共享的模式比较单一。
在李卫东《政府信息资源共享的原理和方法》一文中将政府信息资源共享的方法分为三种,分别是:公共数据中心法、虚拟数据中心法、开放式WEB服务法。国家审计数据中心要求多个被审计单位提供数据备份,集中到数据中心存储分析,通过数据规划统一同行业多部门的数据结构。它采用的是“公共数据中心法”建立信息资源共享,把具有全局性的共享数据抽取出来,建立公共数据中心来统一管理和维护这些公共数据,从而实现对公共数据的全面共享,是一种“物理集中”的数据管理模式。
与国家审计数据中心的数据集中模式不同的是,很多地区进行信息资源共享工作,采用虚拟数据中心方法或开放式WEB服务法。虚拟数据中心法是一种“物理分布,逻辑集中”的数据管理模式,数据仍然存放在各个部门,建立虚拟数据中心存储信息资源目录体系,实现信息资源共享。开放式WEB服务法是业务相关的政府职能部门之间自愿、互利的原则基础上,达成信息资源共享的协议,利用WEB服务技术的思想实现信息资源共享的目的。如成都市通过“开放式WEB服务法”方式建立了包括质监、工商、税务、质检、社保、国土、公积金、环保等多部门的数据集中平台。各部门将生产数据映射到联网服务器上,联网服务器由职能部门自己管理,通过约定的接口、约定的数据架构,通过跨部门的实时报文或文件报文进行单一或者批量查询,实现信息的跨部门共享。
各种共享模式各有优缺点,需要同步试点,取长补短。国家审计数据中心采用的公共数据中心法信息资源共享方式,优点是数据集中存放、统一维护,对数据的统一管理和利用比较便利。数据集中存放,可以对数据进行多角度分析,数据分析更加透彻。
但由于很多部门拥有大量的异构数据库,要建立标准化的数据结构难度大,维护成本高。为了解决多部门数据异构的问题,数据中心希望通过数据规划的方式来统一数据结构,实现数据标准化。但多部门数据结构复杂,就算是同一行业也很难将各个单位的数据结构统一起来。另外,由于被审计单位的业务随时可能发生变化,相应的数据结构需要进行调整,数据规划也必将根据被审计单位业务的变化进行调整。全凭审计部门一己之力,无法跟踪调整多行业数据规划,所以公共数据中心法实施、维护难度大。
在法律法规不完善的情况下,运用公共数据中心法数据采集数据,各部门信息共享的积极性不高,推进难。国家审计数据中心的集中模式,靠审计项目执行过程中进行采集,缺乏数据采集存储的法律依据。在非审计项目期间,要求被审计单位提供所有的业务电子信息,被审计单位缺乏积极性。部分被审计单位的信息属于敏感信息,存在种种顾虑,给信息共享带来阻力。成都市在信息共享工作中,由工信委牵头,政府各职能部门本着互利的原则,仅将核心业务中涉及公用信息的部分参与共享,加入信息共享平台的部门也可以从其他部门获得自己需要的信息,实现双赢,部门积极性高。
所以,针对现阶段信息共享的特点,可以通过多种共享模式试点,探索信息共享平台的建立方式。国家审计数据中心继续深入地对多部门的数据进行采集分析。同时可以考虑在个别地区,就采用开放式WEB服务法和虚拟数据中心法方式进行信息共享的环境进行试点,本着互信互利的原则,通过加入地方部门信息共享平台的方式,探索信息资源平台的搭建、审计分析的方法、对审计人员的新要求等内容。

(三)审计分析方法局限,需要创新审计模式。

目前计算机审计主要采用数据审计模式和信息系统审计模式,主要解决单个部门或者行业的审计问题。面对多部门、多级次、多类型的多维海量数据,上述两种审计模式将面临几大难题:一是多渠道的数据采集难度大;二是异构的数据结构分析工作量大;三是凭借数据关联进行海量数据分析困难大。在信息共享的情况下,两种审计模式必然不能满足审计工作的新要求。另外,审计领域也经常谈到联网审计,它仅仅是描述审计采用的网络技术手段,没有将采用的审计分析方法涵盖在内,不能完整贴切地描述信息共享环境下的多数据源审计模式。所以在信息共享环境下,需要转变审计技术方法,创新审计模式。

二、数据仓库审计模式:解决信息有效利用的途径

笔者认为,要解决数据共享环境下审计模式遇到的难题,既要体现多部门、多数据源的特点,还要展现审计分析的方法,可以借鉴数据仓库的理论基础,创建“数据仓库审计模式”。

(一)数据仓库审计模式简介。

数据仓库概念始于上世纪80年代中期,首次出现是在被誉为“数据仓库之父”WilliamH.Inmon的《建立数据仓库》一书中。目前,数据仓库技术已经广泛运用于管理,它能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供分析使用。它不单单是一种大型的数据存储机制,而更像一个过程,这个过程涉及数据的收集、整理、加工,生成决策所需要的信息,并且最终把这些信息提供给需要这些信息的使用者,供他们分析,做出正确的决策。
“数据仓库审计模式”将是在信息共享机制建立的基础上,利用数据仓库技术,建立长效的数据共享平台,根据审计目标,运用指标分析、多维分析和数据挖掘方法,开展审计的信息化审计模式。它可以对不同历史年度,不同部门,不同行业的多维数据进行综合分析。

(二)数据仓库审计模式功能。

数据仓库审计模式可以解决数据审计模式和信息系统审计模式遇到的几大难题。首先,在数据仓库审计模式下,对各行业、各部门的数据形成数据集市,审计人员可以直接通过数据集市获取其他部门的数据,解决了多渠道数据采集难度大的问题。其次,数据仓库审计面向的对象是数据仓库数据,与数据审计模式面向的数据库数据不同,它是经过收集、整理和加工,直接用于分析的数据,结构简单,也比较稳定,不需要审计人员耗费大量的精力对数据结构进行分析,解决了各部门异构的数据结构分析工作量大的问题。最后,面向对象的多维分析和数据挖掘方法对海量数据进行分析,将解决仅依靠关系型数据关联查询不能解决的问题,发现潜在的、新颖的、有效的数据关系,拓展审计思路。

(三)数据仓库审计模式实践。

数据仓库审计模式有数据仓库理论基础,可以与审计实践相结合,进行深入探索。在数据仓库分析模型的基础上,建立以下审计模型(如图1),分四个步骤实现数据仓库审计。
  
       

图1 信息共享环境下的数据仓库审计模式

步骤一 建立共享机制,实现数据获取。通过信息共享平台的搭建,与各部门建立信息共享机制,实现数据的获取,在获取阶段对各部门数据进行清洁、传输,加载到审计数据仓库中。建立的审计数据仓库,数据可以物理方式地存在国家审计数据中心,也可以在网络的基础上,通过虚拟方式汇入数据仓库。
步骤二 多维建模与数据管理。建立多主题的多维数据模型,设置刷新机制,并将数据仓库中的数据作存储。
步骤三 审计分析。利用数据进行审计分析,可以对数据进行指标分析、多维分析、数据挖掘。
步骤四 知识总结、应用开发。对审计的技术方法进行归纳总结,指导其他审计组和日后的审计工作,对好的审计方法,形成应用模块。

那么,在各部门信息共享环境下,数据仓库审计模式如何实施?
假定银行、工商、证券三个行业(部门)采用公共数据中心方法建立的信息共享平台,构建以下数据仓库审计模式流程图,如图2。

      

图2 信息资源共享条件下数据仓库审计举例

在步骤一中,建立共享机制,实现数据获取。审计与三部门建立了共享机制,各部门分别将自己的共享数据形成“综合数据表”,汇集到审计数据仓库中。“综合数据表”直观地记录了各部门核心业务数据,但不包含各部门数据库中用于内部管理的数据资料。如银行综合数据表包含企业银行对账单,企业贷款信息等基础的数据,但不涉及银行柜员资料,内部审核流程等内部管理数据;工商综合数据表包含企业工商注册基本要素,股东名单等;证券综合数据表包含各投资人证券交易明细等信息。
与数据审计模式和信息系统审计面对的原始数据库、表不同,综合数据表数据内容直接反映经济活动,一张综合数据表就能反映一个完整的经济活动,包含了原始数据库、表数十、数百张表的实质内容,更加直观。其次,通过各部门综合数据表构建审计数据仓库,利用数据接口自动生成综合数据表,避免了数据审计模式中数据整理和数据库数据结构分析的麻烦,大大提高审计效率。
在步骤二中,通过维表搭建数据模型。“维表”描述不同的表之间的关系,维表包含银行账号、工商注册号、证券账号,以及各个账号之间的关系,描述哪些是同一户企业的账号。通过这样的维表,审计可以通过简单的关联,将银行数据、工商数据和证券数据有机地结合起来,形成一个多维的数据立方体。
在步骤三中,主要运用联机分析处理 (OLAP)工具进行审计分析。联机分析处理是针对特定问题的联机数据访问与分析,也可以说是多维数据分析工具的集合。它通过多维的方式对数据进行分析、查询和报表。多维分析是指对以多维形式组织起来的数据采取切片(Slice)、切块(Dice)、旋转(Pivot)、钻取(Drill-down和Roll-up)等各种分析动作,以求剖析数据,使审计人员能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。
可见,面对多部门、多维度数据时,数据仓库审计模式简化了数据采集程序、数据结构关系更加简单清晰、审计分析方法更加直观,将大大提高审计效率。

(四)搞好数据仓库审计模式的几点建议。

一是延续以往的好做法,运用已有的内部管理信息系统,加强对项目的纵横向管理,继续推进信息化审计模式发展以来形成的,以“总体分析、发现疑点、分散核查、系统研究”为特征的总体分析审计方式,大力发展大项目管理模式;二是利用网络和数据接口,频繁地进行共享数据更新,实施实时的审计监督,有效防范重大违法违规和腐败现象,充分发挥审计“免疫系统”功能;三是强化外部审计证据取证工作,发挥多部门数据分析的优势,更加有效检查信息系统的有效性、安全性,提升审计工作质量;四是将宏观数据与微观数据相结合,提升审计分析的高度,综合分析宏观政策的执行情况,为制度建设献言献策;五是要求审计人员掌握更多的网络和数据库知识,熟悉内部管理信息化工具,适应新的审计组织方式,发挥主观能动性和审计组的整体能力,开展信息共享环境下的审计。(曹晟  雷应轩)
【关闭】    【打印】