稅收風險管理方案
一、背景
1、信息技術(shù)發(fā)展背景
近幾年,信息技術(shù)快速發(fā)展,特別是近兩年,云計算、大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,核心技術(shù)從概念到理論,從實驗環(huán)境到成功落地,反過來又推動了技術(shù)的進一步發(fā)展。隨著網(wǎng)絡帶寬的不斷拓展以及移動互聯(lián)網(wǎng)的快速發(fā)展,信息應用系統(tǒng)迅速的從電腦終端,拓展到平板、以及手機終端,信息技術(shù)疊加移動互聯(lián)網(wǎng)的快速發(fā)展,推動了各行各業(yè)的信息化發(fā)展,對政府部門的信息化和現(xiàn)代化提出了更高的要求。特別是國務院印發(fā)了《關于積極推進“互聯(lián)網(wǎng)為+”行動的指導意見》,開啟了我國通往“互聯(lián)網(wǎng)+”時代的大門,對政府部門的信息化提出了更高的要求。
長期以來,稅務系統(tǒng)積極利用現(xiàn)代信息技術(shù)改造、提升稅收管理服務等核心內(nèi)容,取得了顯著成績。在上世紀90年代起,稅收征管信息化就逐漸起步,從金稅一期、二期、三期的不斷推進,著力把稅收工作放在“網(wǎng)”上運行,用先進的信息系統(tǒng)支撐復雜的稅收業(yè)務系統(tǒng)。國家稅務總局局長王軍一針見血的指出,沒有稅收信息化,就沒有稅收現(xiàn)代化,提出了在2020年基本實現(xiàn)稅收現(xiàn)代化的奮斗目標。在稅務系統(tǒng)信息化過程中,要“善假于物”,利用“互聯(lián)網(wǎng)”技術(shù),形成“互聯(lián)網(wǎng)+稅務”規(guī)劃和行動方案,在辦稅服務上,開發(fā)電子稅務局,實現(xiàn)納稅人足不出戶辦稅;在稅收征管上,加強新技術(shù)的運用,建立數(shù)據(jù)分析大數(shù)據(jù)平臺。
2、互聯(lián)網(wǎng)+
在國家“互聯(lián)網(wǎng)+”戰(zhàn)略提出后,各部門、行業(yè)相繼推出了“互聯(lián)網(wǎng)+醫(yī)療”、“互聯(lián)網(wǎng)+物流”等等,各行各業(yè)都在積極探索在新常態(tài)下的轉(zhuǎn)型升級,越來越多的數(shù)據(jù)通過互聯(lián)網(wǎng)發(fā)送、傳播、存放,反映企業(yè)基本信息、經(jīng)營信息、投資信息等,互聯(lián)網(wǎng)上的信息越來越多,占比越來越廣,類型也越來越豐富。由于互聯(lián)網(wǎng)數(shù)據(jù)涵蓋企業(yè)庫存管理、采購銷售、財務核算等,所以數(shù)據(jù)真實可靠,通過與稅務機關內(nèi)部的納稅人申報數(shù)據(jù)比對,直接就可反映企業(yè)申報的真實性和準確性,方法簡單,應對有效。當然在互聯(lián)網(wǎng)上,還存在很多其他類型的數(shù)據(jù),并不能用傳統(tǒng)的二位關系表來存放,以往對該類型的數(shù)據(jù),只能舍棄,但從實踐經(jīng)驗來看,此類信息能很好的印正企業(yè)的實際經(jīng)營情況,如簽訂的合同、人員的招聘等等。在市場經(jīng)濟快速發(fā)展的推動下,企業(yè)的經(jīng)營方式越來越復雜,相對而言,稅務部門管理方式還是延續(xù)傳統(tǒng)的方式,通過數(shù)據(jù)的簡單比對,根據(jù)個人經(jīng)驗,設計指標體系來揭示企業(yè)可能存在的風險,面臨疑點信息不夠有效、分析過程不夠全面等不不足。
在稅務總局的規(guī)劃指導下,各地稅務系統(tǒng)積極開展“互聯(lián)網(wǎng)+稅務“行動計劃,江蘇省蘇州市國稅局以“智慧蘇州”為抓手,打造網(wǎng)上納稅服務體系;深圳市國稅局堅持“痛點思維”,加快建設“互聯(lián)網(wǎng)+電子稅務局”等等。從各地實踐來看,在納稅服務領域,運用互聯(lián)網(wǎng)思維,比較好探索嘗試,就是把實體辦稅廳辦理的業(yè)務移植到網(wǎng)上,通過互聯(lián)網(wǎng)辦理,可以用電腦、平板、手機等多終端辦理,方便納稅人辦稅。同時通過各服務平臺信息的推送、稅企互動交流,納稅人通過多種渠道,可以獲取相關信息,為納稅人提供服務。
3、稅收風險管理分析
是在稅收管理方面,很少提到用互聯(lián)網(wǎng)+思維方式,尤其是在稅收風險管理方面,分析其原因主要存在以下幾個問題:
1、風險分析以納稅人申報數(shù)據(jù)和稅務部門內(nèi)部數(shù)據(jù)為準,很少拓展到其他數(shù)據(jù)來源;
2、風險分析以結(jié)構(gòu)化數(shù)據(jù)為主,很少涉及非結(jié)構(gòu)化數(shù)據(jù);
3、由于缺乏平臺的支持,數(shù)據(jù)的分析以簡單比對為主,較少涉及數(shù)據(jù)模型的建立和數(shù)據(jù)挖掘算法的實現(xiàn)。
基于以上分析,在“互聯(lián)網(wǎng)+”時代,急需要打造一個平臺,通過通用采集和非定點采集程序,自動獲取企業(yè)在互聯(lián)網(wǎng)上的各類信息,包括電商數(shù)據(jù)、招投標數(shù)據(jù)、行業(yè)網(wǎng)站數(shù)據(jù)、土地市場網(wǎng)、團購網(wǎng)、上市公司信息、招聘信息、經(jīng)營合同、信用評級等,并通過接口獲取政府部門第三方信息,以及稅務部門內(nèi)部數(shù)據(jù),通過整合篩選后,形成反映企業(yè)全貌的信息,為稅務部門管理,包括風險分析和風險應對提供幫助。
二、 大數(shù)據(jù)應用平臺介紹
2.1 建設目標
大數(shù)據(jù)應用平臺的建設目標為建立一體化涉稅數(shù)據(jù)應用的平臺,完成數(shù)據(jù)的采集、整合、分析等功能,為稅務部門管理提供支撐。
平臺的主要特點包括:
1、自動化
數(shù)據(jù)的采集、篩選、整合、分析,都由平臺按照預先的設定自動完成;
2、一體化
平臺包含數(shù)據(jù)加工以及分析應對功能;
3、智能化
基于Hadoop大數(shù)據(jù)架構(gòu)的平臺,利用數(shù)據(jù)挖掘算法,實現(xiàn)數(shù)據(jù)的增值利用;
4、便捷化
使用人員只要輕點鼠標,即能獲取相關信息,得到所要結(jié)果。
大數(shù)據(jù)應用平臺實現(xiàn)海量互聯(lián)網(wǎng)數(shù)據(jù)采集,數(shù)據(jù)類型更廣,不僅局限于結(jié)構(gòu)化數(shù)據(jù),還包括半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),對半結(jié)構(gòu)化數(shù)據(jù),通過語義分析,結(jié)構(gòu)化后入庫,對非結(jié)構(gòu)化數(shù)據(jù),可以通過應用模型,實現(xiàn)自動分類。實現(xiàn)數(shù)據(jù)的整合,利用數(shù)據(jù)挖掘算法,從海量互聯(lián)網(wǎng)信息中挖掘有價值的數(shù)據(jù),通過數(shù)據(jù)的清洗、加工、轉(zhuǎn)換,并按照單戶納稅人進行歸集,形成針對納稅人的全景展示。
互聯(lián)網(wǎng)數(shù)據(jù)的采集方法分兩種:
一種是通用信息采集,通過設定采集路徑、網(wǎng)址,把相關數(shù)據(jù)從互聯(lián)網(wǎng)上采集過來,并通過語義分析,結(jié)構(gòu)化后保存到數(shù)據(jù)庫中;
一種是非定向采集,通過納稅人名稱等關鍵字的設定,獲取排名靠前的信息,把網(wǎng)頁信息保存下來,并相關關鍵字建立分詞索引,為網(wǎng)頁的檢索提高效率。實現(xiàn)數(shù)據(jù)的全景展示,不僅能顯示表單、文檔,還要能查看圖片、收聽音頻、播放視頻等多種類型的文件。
平臺提供接口,通過接口調(diào)用,可以從其他應用系統(tǒng)中接收數(shù)據(jù)。
2.2功能定位
(1)數(shù)據(jù)采集
通用信息采集,通過項目設置菜單,定期采集相關數(shù)據(jù),并通過語義分析,把采集后的數(shù)據(jù)結(jié)構(gòu)化后,保存到數(shù)據(jù)庫中。通用信息采集內(nèi)容,可由使用人員自行維護,根據(jù)需要增加、減少采集內(nèi)容,目前主要包括上交所和深交所公告信息、證券投資基金信息、招標網(wǎng)中標信息、淘寶店鋪信息、淘寶拍賣信息、天貓店鋪成交信息、土地拍賣信息等。非定點采集,主要獲取單戶企業(yè)在互聯(lián)網(wǎng)上有價值的信息,通過搜索引擎,獲取企業(yè)相關信息,如地址、電話等基本信息,投資、簽訂合同等經(jīng)營信息等。非定點采集,需要解決兩個問題,一是要能獲取到信息,二是通過算法設計,對獲取的信息進行篩選,過濾沒有價值的信息,得到有價值的數(shù)據(jù)。
(2)數(shù)據(jù)整合加工
對采集的互聯(lián)網(wǎng)信息,經(jīng)過整理加工后,對結(jié)構(gòu)化數(shù)據(jù)直接入庫,非結(jié)構(gòu)化數(shù)據(jù),進行分類后存放大大數(shù)據(jù)平臺。基于底層Hadoop大數(shù)據(jù)架構(gòu)的數(shù)據(jù)平臺,具有整合各類數(shù)據(jù)的能力,總的來說,分為互聯(lián)網(wǎng)信息、第三方數(shù)據(jù)、稅務部門內(nèi)部數(shù)據(jù)以及企業(yè)內(nèi)部數(shù)據(jù)等,數(shù)據(jù)可以是結(jié)構(gòu)化的,也可以是非結(jié)構(gòu)化的。在整合各類數(shù)據(jù)的基礎,數(shù)據(jù)平臺支持分析人員使用數(shù)據(jù),對數(shù)據(jù)進行分析建模,查找風險企業(yè),同時,運用大數(shù)據(jù)技術(shù),通過數(shù)據(jù)挖掘算法的實現(xiàn),進行關聯(lián)性分析等,讓數(shù)據(jù)發(fā)聲,最大限度提高分析效率、提高風險對象的命中率。
(3)數(shù)據(jù)的展示
數(shù)據(jù)平臺要方便檢索、展示多種類型數(shù)據(jù),包括圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)和傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),而且不需要安裝客戶端程序,只需要用瀏覽器就能實現(xiàn)文件的瀏覽、數(shù)據(jù)的分析,對數(shù)據(jù)平臺中數(shù)據(jù),提供按戶歸集、全景展示功能。方便對單戶企業(yè)進行分析,數(shù)據(jù)范圍包括互聯(lián)網(wǎng)信息、第三方數(shù)據(jù)、稅務部門內(nèi)部數(shù)據(jù)以及企業(yè)內(nèi)部數(shù)據(jù),反映企業(yè)基本信息、經(jīng)營信息、投資信息、申報信息、納稅信息等等,形成內(nèi)容完整、重點突出的納稅人畫像。
2.3使用對象
需要進一步細化
本平臺使用對象為稅務部門管理人員,包括風險分析人員和風險應對人員。
(1)風險分析人員,通過平臺的互聯(lián)網(wǎng)信息采集功能,以及后續(xù)的數(shù)據(jù)整合、加工、分析功能,使用平臺的數(shù)據(jù)比對、模型建立等工具,從宏觀比較,到中觀趨勢,再到微觀觀察,通用行業(yè)類比,從海量納稅人中有針對性的查找風險企業(yè),并能提供疑點報告,為風險應對人員提供支持。
(2)風險應對人員接收到企業(yè)應對任務后,通過數(shù)據(jù)平臺提供的疑點報告,以及強大的單戶分析功能,可以對該戶企業(yè)進行全方位體檢,簡單明了的掌握企業(yè)信息,分析存在的疑點,指出存在的風險,方便快捷的完成案頭分析工作,并可以把應對過程中發(fā)現(xiàn)的線索、收集的數(shù)據(jù)、整理的材料,上傳到數(shù)據(jù)平臺,反映整個應對過程、應對結(jié)果,企業(yè)風險排除情況,豐富企業(yè)信息。
三、功能菜單
1、系統(tǒng)設置
用于項目運行所需要的一些系統(tǒng)設置,包括項目配置、權(quán)限管理等。
(1)項目設置
進行定點采集項目的配置,通過配置,自行增加可以結(jié)構(gòu)化互聯(lián)網(wǎng)信息的采集。如下圖所示:
(2)項目子項設置,用于設置每個項目中相關子項的設置。如大小非項目中,有關股東信息、發(fā)行信息等,設置鏈接、采集周期、是否全量采集等。如下圖所示:
(3)采集字段設置:
用于把信息結(jié)構(gòu)化后,存放到數(shù)據(jù)庫表中,為數(shù)據(jù)的利用做準備。如下圖所示:
2、任務管理
用于采集任務的管理,包括采集時間、周期的設定等。并記錄采集持續(xù)的時間,采集的數(shù)據(jù)大小、是否發(fā)生錯誤等日志信息。
3、數(shù)據(jù)匹配
把通過互聯(lián)網(wǎng)采集的數(shù)據(jù),與機內(nèi)納稅人匹配,為數(shù)據(jù)的分析利用做準備。包括自動匹配、手工匹配、建立匹配規(guī)則等。
把互聯(lián)網(wǎng)采集的數(shù)據(jù),通過納稅人名稱、稅號、工商登記證號等關鍵字與稅務部門登記信息進行比對,對能匹配到的信息,自動匹配并建立匹配規(guī)則。對不能精確匹配的,提供模糊匹建立配功能,由操作員自行選擇匹配對象,建立匹配規(guī)則并保存匹配規(guī)則,以后數(shù)據(jù)就按照建立的匹配規(guī)則自動匹配,不再需要人工干預了。
4、數(shù)據(jù)管理
通過數(shù)據(jù)管理功能,把互聯(lián)網(wǎng)采集數(shù)據(jù)、政府部門涉稅數(shù)據(jù)、稅務部門內(nèi)部數(shù)據(jù)以及其他數(shù)據(jù)按戶歸集。通過數(shù)據(jù)交換,可以把互聯(lián)網(wǎng)采集數(shù)據(jù)與稅務部門內(nèi)部數(shù)據(jù)進行整、比對,同時預留接口,方便接入政府部門涉稅數(shù)據(jù)以及其他各類數(shù)據(jù)。
5、數(shù)據(jù)分析
通過數(shù)據(jù)管理功能,平臺整合了四大類數(shù)據(jù),包括互聯(lián)網(wǎng)采集數(shù)據(jù)、政府部門涉稅數(shù)據(jù)、稅務部門內(nèi)部數(shù)據(jù)以及其他數(shù)據(jù),不僅限于結(jié)構(gòu)化數(shù)據(jù),還包括非結(jié)構(gòu)化數(shù)據(jù)。在此基礎上,風險分析人員可以通過數(shù)據(jù)的整合,風險指標的自行設置,內(nèi)外數(shù)據(jù)的比對,查找風險企業(yè)。風險應對人員通過一戶式功能,可以查詢該應對企業(yè)的所有涉稅信息,包括結(jié)構(gòu)化數(shù)據(jù)以及各類非結(jié)構(gòu)化數(shù)據(jù),并可以直接瀏覽,不需要安裝插件。
一是實行簡單比對,如電商數(shù)據(jù)與內(nèi)部申報數(shù)據(jù)的比對
二是精選現(xiàn)有的指標,形成體系,