多维数据分析在审计实践中的应用
马艳飞(审计署驻昆明特派办)
【发布时间:2010年09月27日】
字号:【大】 【中】 【小】
    多维数据分析也称为联机分析处理(on-line analytical processing,OLAP),是以海量数据为基础的复杂分析技术。它支持分析人员从不同的角度、快速灵活地对数据库中的数据进行多角度查询和分析,并以直观易懂的形式将查询和分析结果展示给分析人员。对需要以大量图表、对比来进行分析的审计项目,具有十分有效、突出的作用。2009年,在某省城市最低生活保障资金(城市低保)审计项目中,我们充分运用该技术,取得了很好的成效。
    以某省城市低保审计为例,要分析反映享受低保人员的性别、文化程度、健康状况、劳动能力、人员类别、单位性质、年龄结构等十余项信息,特别要重点分析该省具备劳动能力人员又享受城市低保人员的年龄结构、健康状况、文化程度等,这既可以使审计人员把握总体,也可以帮助准确确定审计抽查的重点或方向。如果用数据库中传统的二维表格来表示显然不能满足需求,多维数据分析则能很好地解决上述问题。本文基于某省城市低保审计项目中数据及分析来说明多维数据分析在审计中的应用。
    一、数据提取并处理
    进行多维数据分析的前提是对数据提取并处理,使之能够满足多维数据分析的需要。
    1.数据提取。本例原始数据存放在ACCESS数据库中,首先从中找到全市享受城市低保人员的详细信息数据表,因为表中字段值多以代码表示,如性别代码“1”、“0”分别表示“男”、“女”,劳动能力代码“1”、“2”、“3”分别表示“有劳动能力”、“无劳动能力”、“部分丧失劳动能力”等,针对用到的“性别、户口性质、民族、文化程序、婚姻状况、健康状况、劳动能力、人员类别、单位性质、就业状况”字段还要提取对应的代码描述字典表,将这些表导入SQL SERVER数据库中。
    2.字段处理。在SQL SERVER中,将详细信息数据表与字典表关联,将信息数据表中代码替换为文字描述,同时为分组需要,增加“年龄段”字段,并根据按年龄字段的值分别为该字段赋值为“0-9岁”、“10-19岁”、“20-29岁”、“30-39岁”、“40-49岁”、“50岁以上”等。
    3.数据分组汇总。将详细信息数据表按性别、户口性质、民族、文化程序、婚姻状况、健康状况、劳动能力、人员类别、单位性质、就业状况、年龄段等字段分组统计人数,生成一个对应上述字段的事实数据表,表中字段包括“性别、户口性质、民族、 文化程度、婚姻状况、健康状况、劳动能力、人员类别、享受保障金、单位性质、 就业状况、年龄段、人数”,表中记录类似“男、非农业户口、白族、初中、已婚、重病、部分丧失劳动能力、无业人员、是(是否享受保障金)、无(单位性质)、无工作、20至29岁,3(符合前面条件的人数)”,至此数据提取及处理完成。
    二、事实数据表的导出及多维显示分析
    SQL SERVER系统自带Analysis Services软件专门处理多维数据分析,由于该软件并不随SQL SERVER安装而自动安装,且Analysis Service专业性较强,所以本文选择大家较为熟悉的EXCEL软件进行多维数据的显示和分析。
    1.将上面生成的事实数据表导出至EXCEL中,保存为“结构分析.xls”。
    2.打开“结构分析.xls”文件,利用EXCEL的“数据透视表和数据透视图”功能(位于EXCEL的“数据”菜单下),在选择数据源区域时将表中数据全部选中,生成一个新的工作表中,在其中显示数据透视表和透视图的操作界面。
    3.根据分析角度不同,动态调整透视表和透视图的横坐标和纵坐标,以实现不同的分析目的,下面以在数据透视图中的操作为例。
    (1)分析有劳动能力又享受城市低保人员的年龄结构。
        在数据透视图操作界面上,将“人数”字段拖到中间的“请将数据项拖至此处”上、将“年龄段”字段拖到下面的“在此处放置分类字段”上、将“劳动能力”字段拖到右面的“在此处放置系列字段”上。在右侧“劳动能力”字段的下拉列表框中去掉其他项前的对号,只选“有劳动能力”,则各年龄段的人数即可列表显示出来;再在图表上击右键选择图标类型,则可以以不同图表类型显示各年龄段的人数及占比情况。
    (2)分析有劳动能力又享受城市低保人员的健康状况、文化程度。
    在透视图操作界面上,将“劳动能力”字段拖到“请将页字段拖至此处”上、将“人数”字段拖到中间的“请将数据项拖至此处”上、将“文化程度”字段拖到下面的“在此处放置分类字段”上、将“健康状况”字段拖到右面的“在此处放置系列字段”上。在上面 “劳动能力”字段的下拉列表框中去掉其他项前的对号,只选“有劳动能力”,在右面 “状况”字段的下拉列表框中去掉其他项前的对号,只选“健康“、“一般”两项,则各种文化程度的人数即可列表显示出来。我们明显看出:有劳动能力并且身体健康情况良好和一般的人员中,初中、小学、高中、文盲和中专文化水平等低学历人员分列享受城市低保人员的前5位,且初中学历的尤为突出,甚至超出了小学和文盲的合计数,这与我们的常识存在较大的差异,值得关注。
    某省城市低保审计中,审计人员通过运用多维数据分析技术,有效地从不同角度、多个维度分析反映了具备劳动能力又享受城市低保人员的年龄结构、健康状况和文化程度,不但使审计人员把握了总体,而且准确地确定了审计抽查的重点和方向,取得了很好的成效。(马艳飞)
    
【关闭】    【打印】