隨著“人(人類社會)—機(jī)(信息空間)—物(物理世界)”三元的深度融合,數(shù)據(jù)規(guī)模呈爆炸式增長,且數(shù)據(jù)表現(xiàn)形式多樣(包括文本、圖像、視頻、音頻等)、異構(gòu)多源、動態(tài)演變、真?zhèn)位祀s。大數(shù)據(jù)時代,信息在網(wǎng)絡(luò)空間發(fā)布、傳播的渠道更加豐富多樣,導(dǎo)致網(wǎng)絡(luò)空間中的很多信息在未經(jīng)過嚴(yán)格保密審查、未進(jìn)行泄密隱患風(fēng)險評估,或者未意識到信息情報價值的情況下隨意發(fā)布。網(wǎng)絡(luò)空間中非實名制場所和匿名場所的存在使得信息的源頭追溯非常困難,使得敏感信息和高價值信息被公開的同時不承擔(dān)追責(zé)的風(fēng)險。另外,很多泄密信息和泄密事件的知悉者和目擊者并不知道所看到的內(nèi)容是涉密的,可能隨手拍攝并記錄下來傳到網(wǎng)絡(luò)空間。
大數(shù)據(jù)時代模糊了涉密數(shù)據(jù)和非涉密數(shù)據(jù)的絕對界限,碎片化數(shù)據(jù)、模糊化數(shù)據(jù)等傳統(tǒng)意義上被認(rèn)為安全的數(shù)據(jù),在大數(shù)據(jù)時代也有可能引發(fā)泄密事件。將海量的碎片化、模糊化數(shù)據(jù)匯聚到一起,即使這些數(shù)據(jù)在公開之前經(jīng)過了精心的脫密處理,通過深入的大數(shù)據(jù)關(guān)聯(lián)分析,也可以洞察到隱藏在大數(shù)據(jù)表象背后的重要情報。
我國最著名的“照片泄密案”就是通過對公開數(shù)據(jù)關(guān)聯(lián)分析發(fā)現(xiàn)情報的早期案例。日本情報人員根據(jù)《中國畫報》和《人民中國》等刊登的王進(jìn)喜照片和油田建設(shè)報道,準(zhǔn)確地分析出大慶油田的位置、油田規(guī)模以及生產(chǎn)能力等關(guān)鍵信息。有了如此多的情報,日本人迅速設(shè)計出了適合大慶油田開采使用的設(shè)備。因此,當(dāng)我國政府向世界各國征集大慶油田開采設(shè)備的設(shè)計方案時,日本人一舉中標(biāo)。一旦這些情報被用于打擊摧毀的軍事戰(zhàn)略意圖,后果難以想象。
2007年3月,美國海軍部情報局發(fā)布了《中國海軍2007》內(nèi)部手冊,其內(nèi)容主要來自China’s Maritime Strategy,The Great Wall at Sea: China’s Navy Enters the Twenty-First Century,《中國國防白皮書》《中國海軍百科全書》《海軍大辭典》等國內(nèi)外出版的公開資料。該手冊共144頁,分為16個章節(jié)。與傳統(tǒng)的美國海軍作戰(zhàn)手冊相比,手冊中并沒有各種艦船的清單和圖解,但卻詳細(xì)介紹了中國海軍的組織體制、領(lǐng)導(dǎo)層、政治工作制度、海軍軍事學(xué)術(shù),以及海軍的人力系統(tǒng)、部隊訓(xùn)練、對外交往、武器裝備等內(nèi)容。
Bellingcat團(tuán)隊對2014年馬航MH17空難事件的情報分析也是一個非常典型的案例。空難事件發(fā)生后,Bellingcat團(tuán)隊根據(jù)飛機(jī)失事地區(qū)的Twitter推文、Instagram照片、YouTube視頻、Google地圖等公開數(shù)據(jù),快速分析出飛機(jī)是被俄制“山毛櫸”導(dǎo)彈擊落,以及導(dǎo)彈發(fā)射器的準(zhǔn)確運輸路線和時間,且空難事故后發(fā)射器最終進(jìn)入俄羅斯境內(nèi),達(dá)到了與情報部門比肩的信息搜集和證實速度。2017年1月24日“東風(fēng)—41”彈道導(dǎo)彈運輸車出現(xiàn)在黑龍江街頭的照片在互聯(lián)網(wǎng)上引起廣泛熱議,一旦相關(guān)的報道、照片、視頻、地圖等公開信息被人聚合在一起進(jìn)行類似馬航MH17空難事件的情報分析,一些涉密信息和重要情報將不可避免地被泄露。
以美國為代表的信息優(yōu)勢國家意識到公開數(shù)據(jù)中蘊藏的情報價值和泄密隱患,非常重視通過大數(shù)據(jù)分析進(jìn)行情報挖掘與泄密監(jiān)測,力圖實現(xiàn)“在任何國家、從任何語言”獲取開源情報的能力,以支撐和強化美國在全球的霸主地位。目前,美國已建立了比較完善的開源情報工作體系。2005年美國國家情報主任辦公室成立了開放源中心(Open Source Center,OSC),2006年又立法啟動了國家開放源事業(yè)計劃(National Open Source Enterprise,NOSE),專注公開信息的搜集、共享和分析,規(guī)定任何情報工作必須包含開源成分。美國廣泛開展針對特定人群的情報收集任務(wù),并將社交媒體、學(xué)術(shù)數(shù)據(jù)庫等作為重要信息來源。
例如,2009年美國憂思科學(xué)家聯(lián)盟(The Union of Concerned Scientists)發(fā)布的Anti-Satellite (ASAT) Technology in Chinese Open-Source Publications報告認(rèn)為,雖然中國刻意減少反衛(wèi)星導(dǎo)彈研發(fā)的透明度,但同時會在學(xué)術(shù)資源數(shù)據(jù)庫中發(fā)表一些相關(guān)的技術(shù)和非技術(shù)報告,這給美國對中國ASAT技術(shù)的情報分析提供了豐富的信息來源。該報告分析了1971年至2007年的1486篇ASAT武器和技術(shù)相關(guān)的公開學(xué)術(shù)文獻(xiàn),這些文獻(xiàn)來自328個科研機(jī)構(gòu)的957名研究人員,發(fā)表在292種不同的中國期刊上。報告認(rèn)為一些權(quán)威專家發(fā)表的文獻(xiàn)中包含了一些非常具體有用的信息。此外,美國又非常重視對內(nèi)部特定人群發(fā)布消息的規(guī)范和監(jiān)測。2011年出版的《美國軍隊社交網(wǎng)絡(luò)官方指導(dǎo)手冊》針對美國軍人瀏覽互聯(lián)網(wǎng),尤其是使用社交網(wǎng)絡(luò)時對地理標(biāo)注、隱私設(shè)置、視頻發(fā)布等具體內(nèi)容均有詳盡的使用規(guī)范。
美國啟動了包括棱鏡計劃、上游計劃在內(nèi)的一系列項目,構(gòu)建了具有YB級(字節(jié))設(shè)計存儲能力的大數(shù)據(jù)存儲中心,以Accumulo為核心的大數(shù)據(jù)存儲和處理系統(tǒng),形成了完整的情報收集與分析框架和能力。美國通過直接讀取微軟、谷歌、蘋果等網(wǎng)絡(luò)巨頭的數(shù)據(jù)庫和監(jiān)控骨干網(wǎng)網(wǎng)絡(luò)流量,可以接觸到互聯(lián)網(wǎng)用戶的電子郵件、聊天日志、搜索記錄、網(wǎng)絡(luò)社交等數(shù)據(jù)。這說明特定群體尤其是涉密人員的互聯(lián)網(wǎng)言論和行為完全能夠被匯聚在一起,通過碎片拼接似的關(guān)聯(lián)分析即可以挖掘出其中隱藏的涉密信息。
可以看出,大數(shù)據(jù)時代公開數(shù)據(jù)中可能存在著極大的泄密隱患,已有的保密監(jiān)管手段在應(yīng)對這一新型的失泄密風(fēng)險時面臨新的挑戰(zhàn),因此亟須采取一系列措施來降低泄密風(fēng)險和減少不必要的損失。
(原載于《保密工作》2018年第4期)