简体 | 繁體 | English | 网站地图 | RSS订阅
   
当前位置: 首页  >  审计之窗  >  综合论坛 > 正文
 
大数据 巧审计——大数据时代开展计算机审计的几点思考
肖敏(审计署重庆办)
 
【时间:2013年05月02日】 字号: 【大】 【中】 【小】
    随着信息时代的到来,我国社会各领域信息化高速发展,以电子数据为代表的信息资源大集中模式逐渐成为信息化建设和发展的趋势。审计被各种信息包围着,但是审计项目的时间又十分有限,因此,如何应对大数据时代的海量信息与审计时间的矛盾成为在信息化条件下开展审计工作的一个十分实际的问题。对此,笔者进行了几点思考,提出了“大数据,巧审计”的工作思路,即在充分摸清被审计单位信息系统运行特点的基础上,以审计工作目标为导向,全面分析后台数据结构,锁定重点信息资源,依托国家审计数据规划,深入开展数据分析,从浩如烟海的电子数据中寻找数据运行规律,发现审计疑点和问题线索。
       
     一、大数据时代的基本特征
    随着移动互联网、物联网、云计算等的快速发展,及视频监控、智能终端、应用商店等的快速普及,全球数据量出现爆炸式增长,大数据正成为继云计算、物联网之后信息技术领域的又一热点。2009年,全球信息量达到80万PB(1015字节),2010年增至120万PB。据IDC(互联网数据中心)预测,至2020年全球以电子式形存储的数据量将达32ZB(1021字节)。以120万PB数据为例,如果将其刻录在DVD上,再将这些盘片堆叠起来,可从地球到月球垒一个来回。
    大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合”,业界通常用四个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。一是数据体量巨大(Volume)。当前,典型个人计算机硬盘的容量为GB量级,而一些大型企业的数据量已经达到PB量级(1PB=1000000GB)或接近EB量级(1EB=1000PB)。二是数据类型繁多(Variety)。相对于以往便于存储的以文本为主的结构化数据,包括日志、音频、视频、图片、地理位置信息等在内的非结构化数据越来越多,多类型数据对数据的处理能力提出了更高的要求。三是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。如何通过强大的机器算法更迅速地完成数据的价值“提纯”是目前大数据汹涌背景下亟待解决的难题。四是处理速度快(Velocity)。数据流成为高速实时数据流,需要快速、持续的实时处理。
    
    二、大数据时代对审计工作带来的挑战
    近年来,审计署多次统一组织实施上下联动的大型审计项目,如国有商业银行审计、海关审计、国家税收审计、社保资金审计等,通过实施审计,有助于全面摸清某行业或某领域的现状、存在问题及发展趋势,充分发挥审计对于进一步推动和完善国家治理的免疫系统功能。在上述大型审计项目中,被审计单位或行业通常采取了数据大集中的信息资源存储及共享模式,如国有大型商业银行均实现了业务及财务信息总行数据集中,海关领域实现了全国进出口通关数据大集中,国税部门实现了税务数据省级集中存储,社保领域实现了基本社会保险基金数据省级集中存储和使用,下一步还将探索实现全国社保数据大集中。
    采用数据集中存储的信息资源配置模式有利于资源统一规划和使用,为我国社会全面实现信息化奠定了坚实的数据基础,但大数据的“四V”特征在数据存储、传输、分析、处理等方面均带来本质变化,数据量的快速增长为归集、整理、存储及综合利用被审计单位电子数据带来了挑战:一是电子数据高度集成,传统的以审计小组为单位分散审查的审计模式难以有效发挥作用;二是数据量巨大,广泛存在的数字信息无利于审计人员找准审计重点并进行专业判断;三是数据结构复杂,审计人员在短时间内难以全面掌握和了解数据内涵及数据表间勾稽关系;四是数据类型多样,审计人员对非结构化数据进行综合分析和处理的能力有待提高。    
    
    三、大数据时代开展计算机审计的应对策略
    国家“十二五”规划提出要推进经济社会各领域信息化,而数据作为国家和企业的核心资产在推进我国社会信息化建设的进程中发挥着基础性作用。工业和信息化部已经把信息处理技术作为四项关键技术创新工程之一在物联网“十二五”规划上提了出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。审计署针对我国社会信息技术高速发展等外部环境发生的巨大变化提出了加强国家审计信息资源体系建设的工作目标,即以国家审计数据中心为核心,以省级分中心为重点,逐步建立完善中央和地方审计数据中心,构建审计管理、审计业务、审计方法和评价信息资源库,加快推进国家电子审计信息资源目录体系和交换体系建设。为充分应对大数据时代为审计工作带来的挑战,可从以下四个方面入手加强对大数据的分析、挖掘与利用,掌控数据审计的“金钥匙”。
        
    一是摸清信息系统运行特点,关注信息安全防护。通过召开座谈会、发放信息系统调查表、实地查看等方式全面了解被审计单位信息系统建设运行情况,包括信息系统的数量、名称、版本、功能模块、管理部门、访问模式、数据存储等。重点对信息系统的数据资源进行调研,详细了解后台数据库的种类、版本、数据量、存储及备份方式等信息。明确信息安全在大数据发展中的重要地位,加大对大数据安全形势的调查力度,明确大数据的重点保障对象,了解对敏感和要害数据的安全防护措施,加快面向大数据的信息安全审计技术的研究,推动基于大数据的安全审计技术研发,培养大数据安全审计的专业人才,建立并完善大数据信息安全审计体系。
    
    二是紧密围绕审计工作目标,开展数据基础式审计。打破传统的以审计小组为单位分散审查的审计模式,整合全体审计资源,在综合分析审计人员的计算机水平、工作经验、专业审计领域等情况的基础上,成立数据集中分析团队。以审计工作目标为导向,以数据为基础,按照“总体分析、重点审计业务分析、重点审计事项分析”逐层深入的思路,以“三个坚持”为原则,即坚持数据分析必须以审计业务需求为核心、坚持数据分析对审计实践的指导、坚持审计实践对数据分析的推动,运用信息系统审计技术方法全面分析被审计单位信息系统在建设运行过程中存在的缺陷和不足,明确数据分析的思路和方法,开展数据基础式审计,为审计工作的顺利开展提供技术支持和数据保障。
    
    三是全面分析后台数据结构,锁定重点信息资源。海量数据的汇集加大了对重点及敏感数据审计的难度,对大数据的无序使用也会耗费大量的审计资源。通过查阅被审计单位规章制度,审查单位内部对大数据的使用管理是否到位,是否制定完善的数据库管理和安全操作制度,对重点领域数据库的是否制定了严格的日常监管措施,是否制定了移动设备安全使用规程,是否规范了大数据的使用方法和流程;借助采集的数据库设计文档和数据字典,掌握后台数据结构,明确重点领域数据库的范围;通过采用穿行测试、代码审查、文档查阅等技术方法确定与审计业务紧密相关的核心信息资源,如重点表、重点字段、表间关联及字段含义等,为深入开展数据分析做好准备。
    
    四是依托国家审计数据规划,深入开展数据分析。为加强审计信息资源体系建设,实现审计数据获取、建设、运用等工作的规范化,审计署陆续出台了中央部门预算执行、地方财政、社保、中央企业、国家税收、外资、住房公积金、医保及定点医疗机构等行业或领域的审计数据规划,旨在通过制定标准,逐步实现全国各级审计机关审计管理和审计业务数字化。依托国家审计数据规划,掌握好大数据的存储、分类、挖掘、快速调用和决策支撑等工作,整合大数据处理资源,协调大数据处理和分析机制,建立审计云数据存储平台,推动重点数据库之间的数据互通;共享审计云平台上的服务器运算能力资源,开发计算机审计方法和数据分析工具,运用数据挖掘、移动办公、云计算等技术远程开展海量数据审计分析,深度分析、挖掘出审计疑点及问题线索,以实现数据分析的精准化、深层化,掌控数据审计的“金钥匙”。
    审计思路如下图所示:
    
        
    随着海量数据获取、存储与处理方法与技术的飞速发展,大数据时代已经来临,并对我国社会每个领域都造成了影响。社会对数据透明化与数据共享的日益强烈的需求,以及广泛兴起的数据关联运动、政府数据开放运动,使得数据在审计中的重要性更甚从前。面对大数据时代为审计工作带来的挑战,必须不断更新理念、夯实基础、筹划发展,以数据为核心实现信息技术与审计业务的有机融合,为实现国家“十二五”规划中提出的建设国家电子审计体系的目标奠定坚实的基础。(肖敏)
【关闭】    【打印】
 
管理员信箱 | 版权信息
主办单位:中华人民共和国审计署办公厅  技术支持:审计署计算机技术中心 网站电话:010-62150912\0929\0990  
地址:北京市丰台区金中都南街17号(邮编:100073) 备案编号:京ICP备05071733号  建议使用分辨率:1024×768