岳阳楼区审计局在进行某单位经济责任审计时,根据该单位财务软件的数据接口采集数据,采集结果为三个压缩软件,解压后为公共档案类、固定资产类、总账类XML备份文件,用UltraEdit文本编辑工具文件打开,发现该财务软件为北京用友政务软件有限公司开发的用友A++财政财务管理软件(V6.2)版,审计组采用AO2011数据采集模板和SQL数据库转换等多种方法,始终无法导入A02011系统。计算机审计工作一度陷入停顿。
为了解决问题,笔者从网上查询得知,XML是可扩展标记语言(Extensible Markup Language)的缩写,意为可扩展置标语言、可扩展标记语言或可延伸标示语言,是一种新兴的面向Internet应用并用于描述数据的与平台无关的标记语言。它可以有效描述半结构化,甚至是非结构化的数据,具有操作简便、跨平台、存储与显示分离、易于处理等特点,也是当今处理分布式结构信息的有效工具。目前用友、金蝶等部分财务软件已开始使用XML进行数据传输。笔者曾采用Microsoft Excel、文本文件等方式进行XML文件数据采集的方法,采集转换后的数据不仅没有数据表名称,同时转换后的数据文件过大,处理过程复杂,不利于操作,于是决定放弃这些方法。偶然间,笔者想到既然能用Microsoft Excel电子表格处理XML文件,那么也许Microsoft Access数据库也能处理XML数据,于是试了一下,果然成功,将其三个XML文件还原成一个完整的财务数据库,从中找出三张主表和辅助表信息表,将数据进行清洗整理,整理的重点是检查科目表、科目余额表有无编码重复情况,科目余额表各级科目余额是否齐全,凭证表、余额表借贷是否平衡;以及时间、金额等字段类型是否正确,删除重复的科目编码,补齐各级不全的科目余额,将两张辅助科目信息进行整理合并,然后用手工采集进AO2011,将采集的数据与被审单位的纸质数据进行对比,发现数据准确。
最后将采集过程制成采集模板,以备下次使用,大大减轻工作量。