國家保密局網(wǎng)站>>保密科技

大數(shù)據(jù)時代公開數(shù)據(jù)的泄密風險

2018年12月18日    來源:秘書行政司【字體: 打印

隨著“人(人類社會)—機(信息空間)—物(物理世界)”三元的深度融合,數(shù)據(jù)規(guī)模呈爆炸式增長,且數(shù)據(jù)表現(xiàn)形式多樣(包括文本、圖像、視頻、音頻等)、異構多源、動態(tài)演變、真?zhèn)位祀s。大數(shù)據(jù)時代,信息在網(wǎng)絡空間發(fā)布、傳播的渠道更加豐富多樣,導致網(wǎng)絡空間中的很多信息在未經(jīng)過嚴格保密審查、未進行泄密隱患風險評估,或者未意識到信息情報價值的情況下隨意發(fā)布。網(wǎng)絡空間中非實名制場所和匿名場所的存在使得信息的源頭追溯非常困難,使得敏感信息和高價值信息被公開的同時不承擔追責的風險。另外,很多泄密信息和泄密事件的知悉者和目擊者并不知道所看到的內(nèi)容是涉密的,可能隨手拍攝并記錄下來傳到網(wǎng)絡空間。

大數(shù)據(jù)時代模糊了涉密數(shù)據(jù)和非涉密數(shù)據(jù)的絕對界限,碎片化數(shù)據(jù)、模糊化數(shù)據(jù)等傳統(tǒng)意義上被認為安全的數(shù)據(jù),在大數(shù)據(jù)時代也有可能引發(fā)泄密事件。將海量的碎片化、模糊化數(shù)據(jù)匯聚到一起,即使這些數(shù)據(jù)在公開之前經(jīng)過了精心的脫密處理,通過深入的大數(shù)據(jù)關聯(lián)分析,也可以洞察到隱藏在大數(shù)據(jù)表象背后的重要情報。

我國最著名的“照片泄密案”就是通過對公開數(shù)據(jù)關聯(lián)分析發(fā)現(xiàn)情報的早期案例。日本情報人員根據(jù)《中國畫報》和《人民中國》等刊登的王進喜照片和油田建設報道,準確地分析出大慶油田的位置、油田規(guī)模以及生產(chǎn)能力等關鍵信息。有了如此多的情報,日本人迅速設計出了適合大慶油田開采使用的設備。因此,當我國政府向世界各國征集大慶油田開采設備的設計方案時,日本人一舉中標。一旦這些情報被用于打擊摧毀的軍事戰(zhàn)略意圖,后果難以想象。

2007年3月,美國海軍部情報局發(fā)布了《中國海軍2007》內(nèi)部手冊,其內(nèi)容主要來自China’s Maritime Strategy,The Great Wall at Sea: China’s Navy Enters the Twenty-First Century,《中國國防白皮書》《中國海軍百科全書》《海軍大辭典》等國內(nèi)外出版的公開資料。該手冊共144頁,分為16個章節(jié)。與傳統(tǒng)的美國海軍作戰(zhàn)手冊相比,手冊中并沒有各種艦船的清單和圖解,但卻詳細介紹了中國海軍的組織體制、領導層、政治工作制度、海軍軍事學術,以及海軍的人力系統(tǒng)、部隊訓練、對外交往、武器裝備等內(nèi)容。

Bellingcat團隊對2014年馬航MH17空難事件的情報分析也是一個非常典型的案例?针y事件發(fā)生后,Bellingcat團隊根據(jù)飛機失事地區(qū)的Twitter推文、Instagram照片、YouTube視頻、Google地圖等公開數(shù)據(jù),快速分析出飛機是被俄制“山毛櫸”導彈擊落,以及導彈發(fā)射器的準確運輸路線和時間,且空難事故后發(fā)射器最終進入俄羅斯境內(nèi),達到了與情報部門比肩的信息搜集和證實速度。2017年1月24日“東風—41”彈道導彈運輸車出現(xiàn)在黑龍江街頭的照片在互聯(lián)網(wǎng)上引起廣泛熱議,一旦相關的報道、照片、視頻、地圖等公開信息被人聚合在一起進行類似馬航MH17空難事件的情報分析,一些涉密信息和重要情報將不可避免地被泄露。

以美國為代表的信息優(yōu)勢國家意識到公開數(shù)據(jù)中蘊藏的情報價值和泄密隱患,非常重視通過大數(shù)據(jù)分析進行情報挖掘與泄密監(jiān)測,力圖實現(xiàn)“在任何國家、從任何語言”獲取開源情報的能力,以支撐和強化美國在全球的霸主地位。目前,美國已建立了比較完善的開源情報工作體系。2005年美國國家情報主任辦公室成立了開放源中心(Open Source Center,OSC),2006年又立法啟動了國家開放源事業(yè)計劃(National Open Source Enterprise,NOSE),專注公開信息的搜集、共享和分析,規(guī)定任何情報工作必須包含開源成分。美國廣泛開展針對特定人群的情報收集任務,并將社交媒體、學術數(shù)據(jù)庫等作為重要信息來源。

例如,2009年美國憂思科學家聯(lián)盟(The Union of Concerned Scientists)發(fā)布的Anti-Satellite (ASAT) Technology in Chinese Open-Source Publications報告認為,雖然中國刻意減少反衛(wèi)星導彈研發(fā)的透明度,但同時會在學術資源數(shù)據(jù)庫中發(fā)表一些相關的技術和非技術報告,這給美國對中國ASAT技術的情報分析提供了豐富的信息來源。該報告分析了1971年至2007年的1486篇ASAT武器和技術相關的公開學術文獻,這些文獻來自328個科研機構的957名研究人員,發(fā)表在292種不同的中國期刊上。報告認為一些權威專家發(fā)表的文獻中包含了一些非常具體有用的信息。此外,美國又非常重視對內(nèi)部特定人群發(fā)布消息的規(guī)范和監(jiān)測。2011年出版的《美國軍隊社交網(wǎng)絡官方指導手冊》針對美國軍人瀏覽互聯(lián)網(wǎng),尤其是使用社交網(wǎng)絡時對地理標注、隱私設置、視頻發(fā)布等具體內(nèi)容均有詳盡的使用規(guī)范。

美國啟動了包括棱鏡計劃、上游計劃在內(nèi)的一系列項目,構建了具有YB級(字節(jié))設計存儲能力的大數(shù)據(jù)存儲中心,以Accumulo為核心的大數(shù)據(jù)存儲和處理系統(tǒng),形成了完整的情報收集與分析框架和能力。美國通過直接讀取微軟、谷歌、蘋果等網(wǎng)絡巨頭的數(shù)據(jù)庫和監(jiān)控骨干網(wǎng)網(wǎng)絡流量,可以接觸到互聯(lián)網(wǎng)用戶的電子郵件、聊天日志、搜索記錄、網(wǎng)絡社交等數(shù)據(jù)。這說明特定群體尤其是涉密人員的互聯(lián)網(wǎng)言論和行為完全能夠被匯聚在一起,通過碎片拼接似的關聯(lián)分析即可以挖掘出其中隱藏的涉密信息。

可以看出,大數(shù)據(jù)時代公開數(shù)據(jù)中可能存在著極大的泄密隱患,已有的保密監(jiān)管手段在應對這一新型的失泄密風險時面臨新的挑戰(zhàn),因此亟須采取一系列措施來降低泄密風險和減少不必要的損失。

(原載于《保密工作》2018年第4期)