看起來紛繁復雜的海量數(shù)據(jù)資料,通過分析,可以發(fā)現(xiàn)很多有用的信息,可以告訴我們很多隱藏在數(shù)字背后的秘密,并有效提高決策的準確性。淘寶根據(jù)購物記錄可以推薦買家可能會喜歡的商品,餐廳根據(jù)用餐記錄可以推薦消費者可能喜歡的菜單。大數(shù)據(jù)審計分析可以通過對相關領域長年累月形成的數(shù)據(jù)的分析,挖掘出某種群體行為的特點,提示某種社會現(xiàn)象的潛在規(guī)律,為政府制定政策提供關鍵依據(jù),同時還可以評估政府政策的實施效果,從而幫助政府不斷發(fā)現(xiàn)問題,改進問題。下面筆者結合自己從事的地稅審計業(yè)務淺談在大數(shù)據(jù)審計分析中的心得體會,以達拋磚引玉之目的。
一、大數(shù)據(jù)環(huán)境下面對的數(shù)據(jù)類型
我們平常所說的計算機數(shù)據(jù)分析,是對結構化數(shù)據(jù)運用SQL查詢進行的分析。所謂結構化數(shù)據(jù),即行數(shù)據(jù),是存儲在數(shù)據(jù)庫里,可以用二維表結構來邏輯表達實現(xiàn)的數(shù)據(jù)。結構化數(shù)據(jù)通過SQL Server、Oracle等關系型數(shù)據(jù)庫系統(tǒng)進行存儲,是我們開展地稅審計工作中最常使用的數(shù)據(jù)類型。而不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)即稱為非結構化數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等等。所謂半結構化數(shù)據(jù),就是介于完全結構化數(shù)據(jù)(如關系型數(shù)據(jù)庫、面向對象數(shù)據(jù)庫中的數(shù)據(jù))和完全無結構的數(shù)據(jù)(如聲音、圖像文件等)之間的數(shù)據(jù),HTML文檔就屬于半結構化數(shù)據(jù)。它一般是自描述的,數(shù)據(jù)的結構和內容混在一起,沒有明顯的區(qū)分。
在稅務部門的日常工作中,有很多信息是以非結構化數(shù)據(jù)的形式存儲和使用的。比如納稅人基本資料、經(jīng)營狀況、辦公場所情況及企業(yè)財務報表等是以圖片資料或報表的形式提交至地方稅務機關;某些與應納稅額相關的信息則可以在工商、房產(chǎn)交易等有關職能部門的公開網(wǎng)站上進行查詢,同時百度等搜索引擎能夠在互聯(lián)網(wǎng)范圍內為審計人員提供幫助。如在核查房地產(chǎn)企業(yè)繳稅情況時,其開發(fā)樓盤的行政審批進度、樓盤屬地及性質、項目完成情況及市場運行情況、售賣情況等信息是核定其應納稅額的重要參考依據(jù),在稅收征管審計過程中,審計人員可以從網(wǎng)絡上獲取這些信息,讓這些以圖片或網(wǎng)頁方式存在的非結構化數(shù)據(jù)為我所用。
二、大數(shù)據(jù)環(huán)境下的地稅審計技術方法
在目前的地稅大數(shù)據(jù)審計分析中,審計人員以地稅部門稅款征收、管理、稽查等主要業(yè)務環(huán)節(jié)的內部控制為主線,通過對稅款申報、征繳數(shù)據(jù)和相關外部數(shù)據(jù)等內外結構化數(shù)據(jù)的分析,結合收集到的半結構化和非結構化數(shù)據(jù),對稅收收入的真實性、合法性進行重點審計。同時,把握稅收征管改革方向,關注與宏觀經(jīng)濟發(fā)展相協(xié)調的稅收政策執(zhí)行情況的審計,促進強化稅收執(zhí)法力度,規(guī)范稅收管理行為,提升稅收征管質量和效率。
1、多表數(shù)據(jù)關聯(lián)分析
(1)多稅種分析。根據(jù)現(xiàn)有稅收法律法規(guī),在商品房預售過程中,營業(yè)稅(銷售建筑物或構筑物)、核定征收的印花稅(產(chǎn)權轉移書據(jù))、土地增值稅(未開始清算)之間的計稅依據(jù)應該是一致的。審計人員通過多個數(shù)據(jù)表的關聯(lián),對(房地產(chǎn))企業(yè)全年的繳稅記錄按照稅款所屬期和稅種進行排序,然后分析比較同一個所屬期中,企業(yè)的銷售建筑物或構筑物營業(yè)稅、核定征收產(chǎn)權轉移書據(jù)印花稅和未進行過清算的土地增值稅之間的計稅依據(jù)是否一致,如不一致,則作為疑點進行延伸了解。當然,這樣的疑點可能會比較多,我們可以設定一個閾值,比如可以選擇營業(yè)稅應繳稅費超過100萬元以上企業(yè)進行分析比較。
審計分析需要注意的是,如果印花稅實行查賬征收(合同總金額),則其計稅依據(jù)與其他稅種就不具備上述每個所屬期一致的特點。對于實行尾盤銷售的項目,其土地增值稅計稅依據(jù)與其他兩個稅種也會不一致。
(2)網(wǎng)絡發(fā)票開票數(shù)據(jù)與繳款數(shù)據(jù)關聯(lián)分析。網(wǎng)絡發(fā)票是指開票單位或個人通過稅務部門的網(wǎng)絡發(fā)票管理系統(tǒng)開具的發(fā)票。審計人員首先對發(fā)票有關的表進行分析,了解各字段含義,并統(tǒng)計企業(yè)全年開票總金額(開票方)超過一定閾值以上單位。然后分析開票額超過閾值以上的單位當年營業(yè)稅納稅情況,比較并篩選出開票額與營業(yè)稅計稅依據(jù)差距較大的企業(yè)。通過“開票金額”與“營業(yè)稅計稅依據(jù)”相減,在差額結果中,挑選有開票金額無營業(yè)稅交納情況的單位和開票金額和營業(yè)稅計稅依據(jù)均存在但其差額為一定金額以上的單位。最后把得到的疑點數(shù)據(jù)推送地稅部門進行分析和核實。
(3)稅費數(shù)據(jù)對比分析。以娛樂業(yè)文化事業(yè)費征繳為例, 審計人員以納稅人實際交納的娛樂業(yè)營業(yè)稅為基礎,測算出應交納文化事業(yè)建設費金額,對比該納稅人實際交納的文化事業(yè)建設費,得出疑似少交文化事業(yè)建設費的疑點數(shù)據(jù)。
2、通過趨勢分析,查找企業(yè)提前或延遲入庫稅款情況
對稅收收入構成和年度變化趨勢進行分析,各稅種間橫向變化趨勢與稅種自身縱向變化趨勢進行分析,各行業(yè)稅收趨勢進行分析,掌握稅收增減變化情況,分析影響增減變化的原因,對差異較大的異常情況,則作為下一步延伸核查的內容和重點。
(1)稅款異常波動情況分析。一方面通過對企業(yè)全年12個月每個月繳納稅款形成的曲線圖,分析企業(yè)是否存在某一段時間突然顯著降低或上升,比較某稅種在持續(xù)可比的稅收期間(月度、季度等)入庫數(shù)額是否有較大異動,核查是否存在某部分稅款少征漏征,初步判斷企業(yè)是否存在延遲或提前入庫稅款。另一方面,通過對統(tǒng)計報表中分地區(qū)分稅種分年度數(shù)據(jù)對比,掌握某區(qū)域稅收收入增減變化趨勢,了解各地之間是否有爭奪稅源的情況。
(2)大額整數(shù)稅款分析。挑選單筆入庫稅款為10萬(或100萬)整數(shù)倍的企業(yè)進行分析,分析其真實性及合理合規(guī)性。同時,關注入庫日期為6月(所屬期為5月)、12月(所屬期為11月)的營業(yè)稅、城建稅、教育費附加、地方教育附加4項合計金額整數(shù)倍或接近整數(shù)倍的企業(yè),關注其稅款入庫情況。此外,印花稅、土地增值稅一般在各年度按當期實際的銷售收入繳納入庫,因此如出現(xiàn)營業(yè)稅及附加稅費配比正常但沒有預繳土地增值稅和印花稅的情況,則也需考慮其是否存在提前或延遲入庫的現(xiàn)象。
(3)特征分析。通過分析繳款明細數(shù)據(jù)中稅款來源為風險自查等特征數(shù)據(jù),了解地稅部門去年的關注重點,進而找到審計人員的關注重點。
3、結合外部數(shù)據(jù),開展地稅數(shù)據(jù)審計分析
(1)城建稅、教育費附加和地方教育附加均是以三稅(增值稅、消費稅、營業(yè)稅)實際繳納稅額為依據(jù),按照一定比例征繳。而增值稅、消費稅數(shù)據(jù)均在國稅部門,因此審計部門需要通過獲取國稅部門的相關數(shù)據(jù),以對企業(yè)在地稅部門是否涉及少繳附加稅費情況開展審計。同時,關注城建稅、教育費附加和地方教育附加征收范圍和地方教育附加征收標準調整后,執(zhí)行落實情況,有無違規(guī)減免、有無少征漏征等。
(2)通過獲取工商登記數(shù)據(jù),查找是否存在已經(jīng)在工商部門進行了注冊登記,卻未在稅務部門辦理稅務登記而少繳稅的企業(yè);通過對工商股權變更數(shù)據(jù)的關聯(lián)分析,關注企業(yè)、個人股權轉讓中個人所得稅是否足額繳納。
(3)通過獲取國土部門土地出讓數(shù)據(jù),分析企業(yè)是否足額繳納印花稅。并關注土地轉讓過程中的契稅和營業(yè)稅,了解是否存在稅收流失的情況。
4、通過時間等多個維度對多個稅種繳款數(shù)據(jù)進行分析
(1)對房產(chǎn)稅、城鎮(zhèn)土地使用稅的審計。通過對近兩年地稅部門房產(chǎn)稅和城鎮(zhèn)土地使用稅明細數(shù)據(jù)的分析,審查近兩年房、土兩稅變化較大的企業(yè)其稅款變化是否合理;重點審查有無繳納房產(chǎn)稅未繳城鎮(zhèn)土地使用稅、以及繳納城鎮(zhèn)土地使用稅未繳納房產(chǎn)稅的企業(yè)。
(2)對房地產(chǎn)公司企業(yè)所得稅進行審計。以2016年開展地稅部門2015年度預算執(zhí)行情況審計為例。首先,計算2014年全年房地產(chǎn)企業(yè)入庫銷售建筑物或構筑物的營業(yè)稅和企業(yè)所得稅情況(2014年入庫,所屬期為2014年度); 其次,計算2015年對應房地產(chǎn)企業(yè)入庫銷售建筑物或構筑物的營業(yè)稅和企業(yè)所得稅情況(2015年入庫,所屬期為2014年度); 第三,合并前兩步得到整個所屬期為2014年度的入庫企業(yè)所得稅金額和營業(yè)稅金額; 第四,以營業(yè)稅金額測算得到銷售收入金額,進而分別測算企業(yè)毛利潤、毛利率,考慮企業(yè)相關稅費等因素,因此篩選毛利率低于一定閾值的企業(yè)。同時統(tǒng)計各企業(yè)的企業(yè)所得稅納稅申報次數(shù)及實際納稅次數(shù)。最后根據(jù)分析得到的疑點數(shù)據(jù),了解企業(yè)所屬期2014年度,企業(yè)所得稅額偏少的原因以及部分企業(yè)沒有按月(或季度)申報繳納企業(yè)所得稅的原因。
(3)對重點稅源戶的審計。分析重點稅源戶和納稅大戶(年納稅額一定閾值以上)近兩年入庫稅收收入變動情況。重點關注房地產(chǎn)企業(yè)的稅收分析:通過整體分析房地產(chǎn)行業(yè)納稅人營業(yè)稅、城市建設稅及附加、企業(yè)所得稅、土地增值稅、印花稅等之間的內在關系,審查其是否及時足額繳納各項稅收。
5、利用大數(shù)據(jù)開展穩(wěn)增長等政策執(zhí)行情況審計
在稅務管理情況審計上,通過對涉稅大數(shù)據(jù)的分析,把握稅收征管改革方向,重點關注與宏觀經(jīng)濟發(fā)展相協(xié)調的稅收政策執(zhí)行情況;關注對小微企業(yè)降費清稅等相關稅收政策的執(zhí)行落實情況,促進加強納稅服務,確保相關稅收政策落到實處。根據(jù)營改增稅目清單,關注地稅部門在營改增后如何加強稅務管理、稅款征收等方面的工作,分析其對地方稅收的影響。關注預征土地增值稅稅率2014年調整后企業(yè)是否少繳等。
6、結合半結構化數(shù)據(jù)開展總體分析
(1)在稅收預算執(zhí)行情況審計上,首先,通過匯總整個地區(qū)稅收數(shù)據(jù),與取得的當年稅收統(tǒng)計報表相比對,以確認該地區(qū)稅收征管審計取得數(shù)據(jù)的真實完整性。其次,通過對稅收征管數(shù)據(jù)的分析,結合金庫報表、地稅部門會統(tǒng)報表,審計地稅部門稅收預算執(zhí)行情況,分析評價其組織收入的措施及能力。最后通過分稅種、分地區(qū)、分級次分析稅收征管數(shù)據(jù)、與地稅部門會統(tǒng)報表進行核對等方式,了解核實前一年度收入組成及同比增長情況。
(2)根據(jù)稅務稽查數(shù)據(jù)分析結果,確定審計疑點,抽審案件卷宗,關注稽查任務執(zhí)行情況,審查查補稅款是否及時足額入庫。了解前一年土地增值稅已清算房地產(chǎn)企業(yè)名單,審查地稅部門對符合清算的是否及時進行清算,稅款是否及時入庫。
(3)企業(yè)所得稅審計中,通過分析企業(yè)提供給稅務部門的多年財務報表,并集合外部房地產(chǎn)銷售形勢,分析判斷企業(yè)利潤情況真實性。
7、結合非結構化數(shù)據(jù)開展地稅審計
審計人員通過全國工商信息網(wǎng)查閱企業(yè)工商登記信息核實經(jīng)營范圍和開發(fā)資質,通過在房地產(chǎn)市場信息網(wǎng)查詢某樓盤開發(fā)項目的信息,了解該樓盤開發(fā)總套數(shù)、銷售情況以及是否為保障性住房等信息,來核實其營業(yè)稅計稅依據(jù),是否享受稅收減免及是否應進行土地增值稅清算,最后結合結構化的稅款繳款明細數(shù)據(jù),核實該企業(yè)稅款繳納是否及時、足額。
8、開發(fā)工具開展各稅統(tǒng)籌分析
有的時候我們用SQL查詢語句無法直接實現(xiàn)我們希望達到的功能,而目前市面上還沒有符合審計人員特定需求的審計分析工具,因此審計人員就通過有關高級編程語言編寫小工具、小軟件,實現(xiàn)我們需要的功能。
三、大數(shù)據(jù)環(huán)境下的審計取證與數(shù)據(jù)安全
大數(shù)據(jù)時代,一個微小的數(shù)據(jù)泄密,就可能使被審計單位蒙受巨大損失,并可能使得審計部門處于很被動的地位。因此,審計人員和審計機關對取證和數(shù)據(jù)安全應引起足夠的重視,千里之堤,不可潰于蟻穴。必須加大投入,嚴格管理,保證數(shù)據(jù)安全。
1、大數(shù)據(jù)環(huán)境下的審計取證
在大數(shù)據(jù)環(huán)境下,審計證據(jù)的存在形式、內容、獲取的方式等與傳統(tǒng)紙質證據(jù)有明細的區(qū)別。一方面,各種數(shù)據(jù)管理軟件(包括會計軟件)的更新?lián)Q代,增加了數(shù)據(jù)提取的難度。被審計單位的數(shù)據(jù)由于軟件版本的更新和數(shù)據(jù)的逐年積累,數(shù)據(jù)量越來越大,也越復雜,審計人員不得不從浩如煙海的資料中收集整理相關數(shù)據(jù),因此帶來了更多的檢查風險。另一方面,軟件公司為了維護公司利益、保守其技術秘密和商業(yè)秘密,會采用愈來愈嚴格的防范與保密措施,增大了審計取證的困難。
審計人員在取證時,除了傳統(tǒng)取證方式外,還可以采取外部調查、重新計算操作、分析等方法向有關單位和個人獲取審計證據(jù)。審計人員可以根據(jù)情況采取如數(shù)據(jù)分析結果存盤、數(shù)碼拍攝照片、屏幕拷貝圖片等多種電子取證方式。
2、證據(jù)判斷與處理處罰意見
證據(jù)的準確判斷可以迅速鎖定重要問題。在大數(shù)據(jù)環(huán)境下,我們必須進一步審慎對待審計分析結論,并與被審計單位充分溝通。審計組對審計發(fā)現(xiàn)的問題提出處理處罰意見時,除了應當關注法律法規(guī)的條款外,還應當關注行業(yè)標準和規(guī)定,在審計實施過程中還需要持續(xù)關注標準的適用性。
3、電子資料的安全保管
審計人員獲取的被審計單位的數(shù)據(jù)經(jīng)常涉及相關工作秘密或商業(yè)秘密等,因此審計組負有保管和保密義務。由于信息化環(huán)境下,他人只要能訪問電腦,就可能對數(shù)據(jù)文件進行復制并帶走,因此應對相關服務器設置高強度的密碼,并定期更換。審計組應對相關計算機及移動存儲設備采取必要的安全防范措施,落實專人保管,非相關的人員不允許接觸,以防止不法份子盜取審計保密資料。另一方面,從被審單位采集的各類電子數(shù)據(jù)及技術資料,在審計過程中形成或取得的資料、數(shù)據(jù)、文件,未經(jīng)批準,不得向外泄露或向其他人提供。電子資料管理不善,可能給審計人員和被審單位帶來不可彌補的損失,甚至將審計人員自身推上被告席。同時,要注意電子資料(證據(jù)、底稿等)的備份,以防由于軟硬件故障導致資料丟失而使得前面的工作毀于一旦。
審計結束,各種數(shù)據(jù)文檔等,屬歸檔范圍的應及時整理歸檔(可以刻盤存儲),不屬歸檔范圍的應定期銷毀,切實消除各種不安全隱患。
四、當前開展地稅大數(shù)據(jù)審計存在的制約因素
1、涉稅數(shù)據(jù)大集中未形成制度化,數(shù)據(jù)共享有困難
長期以來,涉稅數(shù)據(jù)分散在各個相關單位,沒有進行統(tǒng)一的管理與分析,不利于稅源控管。為了加強綜合治稅,實現(xiàn)涉稅信息全覆蓋管理,提高稅收征管效率,促進財政收入持續(xù)穩(wěn)定增長,部分地區(qū)開展綜合治稅工作,要求涉稅數(shù)據(jù)集中共享,但一些地方仍存在一些制約因素。
(1)數(shù)據(jù)大集中未形成穩(wěn)定的長效機制。目前對涉稅單位缺乏可行的約束機制,導致一些涉稅單位在綜合治稅工作中,存在遲報、缺報等現(xiàn)象,數(shù)據(jù)更新不及時,有的單位只是初期一次性共享一批數(shù)據(jù)(一次性數(shù)據(jù)),后期就再無更新,或者數(shù)據(jù)更新有停頓。隨時間推移,這些數(shù)據(jù)已經(jīng)逐步失去了時效性和使用價值。另外,參與單位年末內部人員崗位變動后經(jīng)常不能及時上報有關部門更新其聯(lián)系人,導致出現(xiàn)找不到聯(lián)系人的情況。
(2)涉稅數(shù)據(jù)的分析利用率有待進一步提高。涉稅數(shù)據(jù)來之于全市多個部門,數(shù)據(jù)內容豐富,數(shù)據(jù)量也越來越大,含有很多有利用價值的信息,然而當前對數(shù)據(jù)利用的深度和廣度有不足。據(jù)筆者了解,很多審計部門如要使用涉稅大數(shù)據(jù),經(jīng)常要經(jīng)過復雜的申請審批程序,而其中國稅部門由于不是我們的審計對象,因此對國稅的數(shù)據(jù)共享更是存在比較大的困難。
2、各部門之間的涉稅數(shù)據(jù)的關聯(lián)性不強,數(shù)據(jù)質量有待提高
大數(shù)據(jù)環(huán)境下開展審計,要求各個部門之間的數(shù)據(jù)一定要能夠有關鍵字段進行關聯(lián),否則就很難達到1加1大于2的效果。
(1)部分部門的數(shù)據(jù)之間缺乏統(tǒng)一的數(shù)據(jù)關聯(lián)標準和規(guī)范。涉稅數(shù)據(jù)來源于不同的部門,涉及的機構多,信息化水平不等,最為突出的是納稅人身份識別碼不統(tǒng)一。工商部門、供電部門、自來水公司、民政局等政府部門及社會公共事業(yè)單位都有各自的編碼規(guī)則。結果同一納稅人在不同的機構、不同的系統(tǒng)有不同的代碼,導致歸集、利用這些不規(guī)范數(shù)據(jù)時效率偏低,在數(shù)據(jù)處理過程中可能會造成有效數(shù)據(jù)的遺失或數(shù)據(jù)匹配錯誤,影響到涉稅大數(shù)據(jù)應用的成效。據(jù)筆者了解,國家目前已明確要求今后將把組織機構代碼作為一個單位的唯一識別碼,就有如自然人的身份證一樣。但此一要求有待各部門對其信息系統(tǒng)的進一步升級。
(2)涉稅各部門的數(shù)據(jù)質量有待提高。一是部分單位的數(shù)據(jù)中缺乏某些重要字段,使得數(shù)據(jù)不具有使用價值;二是金額單位不一致,比如土地轉讓數(shù)據(jù)的“轉讓金額”字段,有時候以元為單位,有的則又以萬元為單位,導致數(shù)據(jù)不便于統(tǒng)計分析;三是部分數(shù)據(jù)缺乏完整的數(shù)據(jù)字典,部分單位提供的報表和數(shù)據(jù)項目,無法利用。
3、部分審計人員還未做好開展大數(shù)據(jù)審計的思想準備
常見的大數(shù)據(jù)技術有關聯(lián)規(guī)則學習、分組、數(shù)據(jù)挖掘、模式識別、預測模型等。因此對審計人員來說,不僅僅要懂得看電子賬和利用SQL語句進行結構化數(shù)據(jù)查詢分析,還要了解非結構化數(shù)據(jù)的特點,學會利用大數(shù)據(jù)工具分析查找規(guī)律、發(fā)現(xiàn)線索。這就需要建立包括懂審計業(yè)務、數(shù)據(jù)分析以及熟悉常用大數(shù)據(jù)分析工具等方面的審計人才團隊。因此,對審計人員開展大數(shù)據(jù)分析培訓的工作任重而道遠。
另外,當前開展大數(shù)據(jù)審計的思路和方法還不是很多,適合審計人員使用的大數(shù)據(jù)分析工具還比較少。