简体 | 繁體 | English | 网站地图
   
当前位置: 首页  >  审计之窗  >  综合论坛 > 正文
 
浅谈数据挖掘技术在商业银行审计中的应用
陈涛(审计署沈阳办)
 
【时间:2013年11月18日】 字号: 【大】 【中】 【小】
    商业银行是国家金融体系的基础。因此,商业银行的重要地位决定了商业银行审计在金融审计中的重要地位。近年来,商业银行业务突显了电子化、虚拟化、数据海量化的特点,而仅依赖传统的审计经验、电子数据的显著特征来发现审计线索变得越来越困难。现代数据挖掘技术的逐渐完善和成熟为提高商业银行审计的效率,预防金融风险提供了技术保障。

    一、金融审计信息化发展现状

    金融审计信息化的发展很大程度上源于被审计单位信息化的迅猛发展,金融、财政、海关、税务等部门和关系国计民生的重要行业开始广泛运用计算机、数据库、网络等现代信息技术进行管理。以金融审计的重点审计对象银行为例,其数据信息在近10年的时间里实现了爆炸性的增长,外汇债券交易平均每天有数十亿的交易量,存款取款电子流每天以数亿次计……数据信息呈现出数据海量化、数据集中化、数据共享化等三方面特点。针对被审计单位数据信息的新特点,为适应新时期审计的需要,为揭露电子化条件下的经济犯罪和会计失真问题,金融审计信息化步伐也明显加快。

    近几年商业银行审计信息化虽然取得了明显成效,但与金融业的发展及社会对金融审计的期望和要求相比、与发达国家商业银行审计相比,我国商业银行审计还存在一定的差距,具体表现为:

    (一)传统的审计理论与现代银行业的发展要求不相适应。一方面,目前金融审计基本还是采用账目基础审计理论,以全部业务和账目为基础,样本抽取的科学性有待进一步加强。另一方面,作为审计对象的银行业却在发生急剧变化,金融全球化、金融业重组和并购,使银行经营规模迅速扩大,经营活动逐渐打破地域限制和行业分割;金融业务和金融工具不断创新;会计核算与风险管理分散化。由此可见,传统的审计理论已不适应现代银行业的发展要求,需要进行发展和创新。

    (二)审计技术方法现代化程度需要进一步提高。近年来的商业银行审计,还是以手工审计为主,对银行一年几千万条业务记录进行检查,审计类似于大海捞针,往往审计结束后审计人员对所检查的内容有没有问题,心中也没有底。而现代银行业电子化程度高,几乎所有的业务交易和会计核算都由计算机自动完成,计算机技术在银行业中的广泛运用对传统手工审计提出了挑战,金融审计人员若不掌握计算机审计技术已无法实施有效监督。若不懂计算机审计技术,就会面临无账可查的尴尬境地。

    (三)审计监督的连续性和系统性不强,防范金融风险的能力亟须加强。按照《中华人民共和国审计法》规定的管辖范围,国有及国有控股商业银行都是审计署及其派出机构的审计范围,而审计署及其特派办从事金融审计的人员不足300人。开展金融审计十多年来,有许多银行的分支机构从未接受过检查,部分国有控股银行只接受过一次审计。由于审计面窄和间隔时间长,不能及时发现和揭露商业银行经营中的问题和风险隐患,弱化了审计监督的作用。

    二、数据挖掘技术在商业银行审计过程中的具体应用

    由于信息化环境下的商业银行审计表现出的上述不足,可以利用数据挖掘的相关技术及方法来改进审计方法,提高审计效率。

    数据挖掘也称为数据库知识发现,是汇集统计学、机器学习、数据库、人工智能等学科内容的一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,发现未知的关系,从中提取辅助商业决策的关键性数据。利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。数据挖掘通过预测未来趋势及行为,作出前摄的、基于知识的决策。

    数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下三大功能:自动预测趋势和行为功能能够在大型数据库中自动寻找预测性信息,直接通过数据得出结论;关联分析功能能够发现数据库中隐藏的一类可信度很高的规则;聚类分析功能将数据库中记录划分为一系列有意义的子集,是数据概念性描述和数据偏差检测的基础;概念性描述功能对一类数据对象的内涵进行描述,并概括这类对象的有关特征;偏差检测功能则能通过查找观测值与参照值的差别,发现数据库中的一些异常数据记录。具体应用步骤如下:

    (一)确定审计目标,准备审计数据。根据审计目标和审计范围,对商业银行信息系统中的数据文件进行采集,得到数据格式、文件大小等均满足要求的数据。对采集到的数据要进行确认,排除遗漏和失误。比较常用的数据传输方法和工具有:采取专用导入导出工具进行采集,通过网络进行采集,通过移动存储介质进行采集。需要注意的是,审计前对被审计商业银行业务流程、信息系统及数据库结构的深入了解至关重要。通常在一个数据库中会有很多数据表,各表之间会存在一些必要的关联关系,在对被审计单位业务充分了解的基础上,可以根据需要只采集审计人员关注的数据表。不能遗漏一些关键性的数据表,数据库系统中有些表虽小,但却是一些代码型文件,这些表是形成审计中间表的基础。

    (二)数据预处理。数据预处理是把采集到的审计数据转换到审计中间表的一系列操作。原始数据中可能存在的问题有很多种,譬如缺失的或不完整的数据、不一致的数据、重复的记录等,有必要在数据挖掘前对数据进行清洗。主要包括不完整数据和空值的处理、冗余数据的清理、错误值的检测等。识别数据表名、字段名、记录值代码以及表间关系的经济含义,将来源于一个或多个源数据的数据,按照审计目标和审计中间表的要求,进行数据字段层面和数据关系层面的变换、分拆或合并,映射到审计中间表,为实施数据挖掘技术做好数据准备。对数据转换和清理过程要进行验证,以保证数据清理和转换工作没有损害数据的完整性、正确性。

    (三)主要的数据挖掘技术。广义的数据挖掘技术主要有:聚类分析、孤立点分析、决策树法、遗传算法、神经网络方法、相关规则方法等。现对其中的几种技术介绍如下:

    聚类分析是一种无指导的学习,受审计人员的主观影响较小。它将数据分组成多个类,同一个类别中的对象之间具有较高的相似度。对于特定交易记录群的聚类分析可以根据不同特征划分为不同的特征群,从而描述各个群的特征,得到违反规律特征的类,找出离群孤立点,对其重点分析,确定审计风险,发现审计线索。比如,对银行不良贷款的审计,通过将影响贷款质量的因素以定性或定量的指标加以描述,再借助于建立数据挖掘模型,从中发现其规律性和普遍的特征,区分贷款的级别,发现人为操纵贷款分类结果的现象。
    孤立点分析用来发现数据源中显著不同于其他数据的对象,例如部分极端值等。在被审计单位的数据源中经常含有一定数量的异常值,它们与审计数据源的其他部分数据不同或不一致,这些数据很可能就是一些可疑的数据,如可利用孤立点分析对信用卡客户历史用卡行为进行分析,如果检测到不寻常的信用卡使用情况,及时确认交易是否存在欺骗等情况。

    决策树法,先根据训练集数据构造决策树,核心是归纳算法。譬如,在商业银行个人贷款业务审计中,利用有问题的个人消费贷款数据,选取所在地区、收入、年龄、婚姻状况、住房情况、是否违约等因素,应用决策树方法进行挖掘,生成客户贷款违约路径规则,该分类规则作为审计的索引。

    (四)审计整理。审计人员对利用数据挖掘技术发现的可疑数据,进行重点核查,查找交易记录,总结得出审计经验,建立审计经验库,如果有新知识,就更新到知识库中,作为日后新交易数据审计的经验。数据挖掘工作是一个不断重复执行的过程。

    数据挖掘技术在金融审计中的深入应用,首先离不开银行等金融机构信息系统数据结构的标准化;其次需要利用银行业务处理逻辑、数据间的勾稽关系、内部数据与外部数据的关联,把有效的审计思路转化为计算机程序语言,有效统一在分析框架内,使数据挖掘分析方法不再零散而成为体系。目前,数据挖掘技术在商业银行审计中的研究相对较多,而在保险、证券等领域涉及较少;在商业银行审计方面也主要集中在信贷业务和存款业务中,在理财产品、国际结算、系统内往来等诸多方面也没有形成系统的数据审计方法。这些都有待于我们在今后的审计过程中认真地加以分析与研究。(陈涛)
【关闭】    【打印】
 
管理员信箱 | 版权信息
主办单位:中华人民共和国审计署办公厅  技术支持:审计署计算机技术中心 网站电话:010-62150912\0929\0990  
地址:北京市丰台区金中都南街17号(邮编:100073) 备案编号:京ICP备19011981号  建议使用分辨率:1024×768