在税收审计中应用多维数据分析
于飞(江苏省泰州市审计局)
【发布时间:2009年07月24日】
字号:【大】 【中】 【小】
    目前,各级税务部门基本都已经建立税收征管信息系统(TIS),经过多年的累积,这些系统中已经形成了大量的有效数据,涉及税务登记、征缴、稽查、减免等诸多方面。对于审计人员来言,如何在税收审计过程中充分利用这些宝贵数据,从大量的事实中迅速地发现最重要的因素,取得所需审计证据,支持自身的专业判断,就显得非常重要。
    多维数据分析(OLAP)是以海量数据为基础的计算机复杂分析技术,它支持审计人员从不同的角度,灵活快捷地对被审计单位的电子数据进行挖掘分析,并以直观易懂的形式展示分析结果。相较于传统的SQL查询,多维数据分析所使用的多维概念和表现模式更符合人的思维习惯,更适宜于高效地聚合、检索、观察和分析数据。因此,审计人员对税收数据进行多维分析,可以更好地把握税收征管情况和发展趋势,形成审计重点和疑点,快速实现审计目标,从而提高税收审计的效率和质量。
    一、税收审计多维数据分析的主要步骤
    一般而言,税收多维数据分析可以分为以下几个步骤:
    确定分析主题 通俗一点的来讲,分析主题就是确定要分析的题目,也就是审计中要重点了解的内容。结合税收审计的目标和特点,审计人员可以选择的多维数据分析主题有:纳税人构成、税收入库、税收退库、欠缴税金、减免税金、税收申报、重点纳税大户、所得税、发票管理、税收政策变动影响、新增税源户分析、关联税种异常监控、未申报及零申报监控、行业税负、收入级距、零入库分析、经济指标与税收收入相关性分析等。可以说,明确了分析主题,就为整个的多维数据分析过程确立了方向。
    设置数据源 多维数据分析的数据源可以直接设置为税务部门的后台数据库,也可以设置为审计人员自己生成的中间数据库。相对而言,后一种方式更为安全、可靠,即审计人员采集、拷贝被审计单位的备份数据,通过OLEDB或ODBC等连接方式将数据导入,在对数据进行“校验”、“抽取”、“净化”等整理操作后,生成所需的审计中间数据库,并以此作为多维数据分析的数据源。
    建立多维数据集 多维数据集也就是常说的数据立方体(Data Cube),它的建立是OLAP分析的关键步骤。多维数据集的两个核心要素是度量值和维度:度量值是审计人员浏览数据集时重点查看的中心指标,一般选用数值型的字段,如入库税额、减免金额等。维度则是审计人员分析指标时所观察的不同角度,如时间维度、地区维度等。维度往往具有多个层次,如时间维可以从年、月、日等不同层次来描述。维度的结构主要有4种,分别是星型、标准型、雪花型和父子型。究竟建立哪种维度模型,要根据具体的需求和事实表、维度表的结构而定,税收审计中比较常用的是星型结构。度量值和维度都对应于所连接数据源的表中字段,确定好度量值和维度之后,就基本上确立了多维数据集的逻辑模型。
    浏览分析数据 建立完多维数据集之后,原来需要反复、多次查询和无法查询的数据信息,就可以通过切片、切块、旋转等操作挖掘出来。审计人员就可以根据实际的业务需求,以时间为纵向主线,以地区、行业、税种等为横向主线,对税收数据进行汇总、关联、聚类、分类、预测等分析,寻找其中隐含的模式和知识,来迅速掌握总体情况。当趋势、异常或者错误被确定后,还可以深入到底层数据进行钻取,作进一步的分析和判断。
    二、税收审计多维数据分析的应用实例
    在对某市政府财政决算审计中,审计人员决定以税款入库情况为主题,进行税收审计多维数据分析,重点要掌握以下情况:全年共入库了多少税款,哪个地区入库金额较大,各税种占的比例有多大,入库的时间集中在什么时候等。审计人员选用的多维数据引擎是SQL Server附带的Analysis Services工具,这是一款具有联机分析处理、决策树和数据挖掘功能的优秀软件。利用Analysis Services,可以快速、简易地实现基于数据仓库的OLAP模型,并方便地进行多维数据集的设计、构建、存储、浏览和分析等操作。
    经了解,该市税务机关各分局的电子数据都集中在市局的服务器中,后台数据库为Sybase大型数据库,主要的数据表包括:税票表、纳税人登记表、税种税目表、预算级次表、提退税金表、征管机关表等。审计人员通过ODBC方式从后台数据库系统采集电子数据,进行了格式定义和数据清理,并最终将其转换为SQL Server数据库格式,为多维数据分析设置好了数据源。
    在多维数据集的设计中,审计人员采用了星型架构,将税票表作为事实表,将纳税人登记表、税种税目表、征管机关表等作为维度表,以入库金额为度量值。之所以采用星型架构,是因为在地税信息系统中,事实数据比较集中,有数百万条记录,而维度数据比事实数据要少得多,高效、易读、清晰,变换维度也不会造成系统太大的工作量,便于建立和分析多维表格。
    多维数据集建立后,审计人员再根据已设计好的维度对数据进行分析。首先是从税种的维度浏览OLAP立方体,汇总计算分税种的入库分布情况。通过观察我们发现,该市的入库税额大部分是由营业税、企业所得税、个人所得税这三个税种贡献的。根据往年的审计经验,营业税、企业所得税是地方税收的主要税种,税额较大是比较正常的,而个人所得税当年入库税额如此之高,甚至比营业税还略有超过,就有点不太正常。根据这一情况,审计人员决定将个人所得税作为下一步的审计重点。
    考虑该市地税局下辖有15个分局,对这么多的分局逐一进行审计是不现实的。为了确定重点审计地区,审计人员又将征管机关维度引入分析区,观察是哪些分局征收的个人所得税出现了异常。结果发现,F分局、N分局的入库个税税额远远高于其他地区。特别是F分局,它所征收的个人所得税几乎占全市总份额的一半。因此,毫无疑问地应将其作为重点核查对象。
    为了更快更准确地挖掘出有用信息,审计人员决定再将入库日期维度纳入分析框架,查看F分局1至12月份的个税入库税额的趋势变化。毕竟,个人所得税的税票记录既多又分散,有时一张税票上的缴税金额才几角钱。即使只有单个分局的税票记录,也足已让人眼花缭乱了。而通过月份维度进行观察,明显看出有几个月的入库税额偏大,12月份尤其值得重视。
    经过多角度的分析,审计人员已经逐步明确了重点,将范围缩小到了F分局12月份征收入库的个人所得税上,接下来的工作就是利用多维数据集的钻取功能,有针对性地调阅具体的税票记录。结果显示,该市地税局F分局在2007年底的12月份,为了完成政府年底突击追加的财政收入任务,将数家重点税源户应在下年征收的个人所得税1000多万元,提前进行了征收。到此,我们便可以得出审计结论,确认地税部门人为调节税收入库进度的违规问题了。
    在这个税收审计案例中,审计人员通过多维数据分析,把握整体,观察趋势,有针对性的延伸取证,使审计实施的过程更加全面和深入。借助这个简单的案例,我们也可以看到多维数据分析在计算机审计上的作用和潜力。实际上,在日常的审计项目中,特别是有着海量数据的大中型审计项目中,多维数据分析还有着更加广阔的应用空间。如果能够很好地掌握这一技术,必将使我们的审计工作如虎添翼,更进一步。



【关闭】    【打印】