1. 新工具帶來新的安全風(fēng)險(xiǎn)
大數(shù)據(jù)用到多種新工具,這些新工具在誕生之初并沒有把安全作為第一要素進(jìn)行考慮,因此是存在安全隱患的,而工具在被大規(guī)模運(yùn)用后這些安全隱患會逐步凸顯出來。以MongoDB為例,它假設(shè)自己運(yùn)行在企業(yè)內(nèi)網(wǎng)環(huán)境中,且假設(shè)內(nèi)網(wǎng)環(huán)境是安全可靠的,因此MongoDB默認(rèn)情況下無需身份驗(yàn)證即可登錄?上攵,如果這樣毫不設(shè)防的數(shù)據(jù)庫如果出現(xiàn)在了互聯(lián)網(wǎng)上,勢必會造成嚴(yán)重的安全問題。
在2016年底之后,出現(xiàn)了一波針對MongoDB的勒索攻擊浪潮,黑客們發(fā)現(xiàn)互聯(lián)網(wǎng)上有大量無需身份驗(yàn)證即可登錄的MongoDB實(shí)例,其中一些數(shù)據(jù)庫中還保存著大量高價(jià)值數(shù)據(jù)。于是黑客們把數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行了加密,并要求受害者支付贖金才能換回?cái)?shù)據(jù)。
美國某個(gè)醫(yī)療機(jī)構(gòu)就是這么中招的,其存放了大量患者個(gè)人及醫(yī)療數(shù)據(jù)的MongoDB被黑客攻擊,醫(yī)院最終被迫無奈向黑客支付了贖金才換回了數(shù)據(jù)庫的控制權(quán),但誰知道在此期間攻擊者有沒有利用MongoDB的漏洞,以MongoDB為跳板進(jìn)而已經(jīng)入侵了企業(yè)內(nèi)部網(wǎng)絡(luò)呢?誰知道攻擊者有沒有把數(shù)據(jù)拖庫,進(jìn)而轉(zhuǎn)賣給了第三方呢?
2. 數(shù)據(jù)污染
大數(shù)據(jù)系統(tǒng)收集的數(shù)據(jù)來自數(shù)量眾多且類型各異的來源,并且對這些數(shù)據(jù)進(jìn)行分析處理后生成更具價(jià)值的數(shù)據(jù),或者基于對數(shù)據(jù)的分析處理來觸發(fā)后續(xù)業(yè)務(wù)邏輯。這一點(diǎn)在運(yùn)用了大數(shù)據(jù)的物聯(lián)網(wǎng)系統(tǒng)中更為常見。由于物聯(lián)網(wǎng)系統(tǒng)中部署了數(shù)量龐大的終端設(shè)備,各種各樣的傳感器、控制器都在產(chǎn)生數(shù)據(jù)并回傳給數(shù)據(jù)平臺做處理。
大數(shù)據(jù)系統(tǒng)中的數(shù)據(jù)流動路徑就像是樹根,每個(gè)根節(jié)點(diǎn)產(chǎn)生的數(shù)據(jù)都會對整棵樹的生長產(chǎn)生影響。攻擊者自然也明白這一點(diǎn),破壞這些根節(jié)點(diǎn)就能破壞整個(gè)大數(shù)據(jù)系統(tǒng)的正常運(yùn)行。例如,如果是大量破壞根節(jié)點(diǎn)使其不能生產(chǎn)數(shù)據(jù),大數(shù)據(jù)系統(tǒng)將面臨“巧婦難為無米之炊”的困境;如果是暗中替換或者篡改了某些根節(jié)點(diǎn)生產(chǎn)的數(shù)據(jù),大數(shù)據(jù)系統(tǒng)的行為可能被攻擊者操控;如果攻擊者能夠偽造根節(jié)點(diǎn)向大數(shù)據(jù)系統(tǒng)傳遞錯(cuò)誤的,或者別有用心構(gòu)造過的數(shù)據(jù),那么大數(shù)據(jù)系統(tǒng)最終產(chǎn)出的數(shù)據(jù)價(jià)值可能大打折扣。
試想一下,某個(gè)養(yǎng)老院中實(shí)施監(jiān)控老年人脈搏、心跳、血壓等等數(shù)據(jù),并基于對這些數(shù)據(jù)的分析處理而觸發(fā)相應(yīng)的警報(bào)、自動呼叫醫(yī)護(hù)人員的系統(tǒng),如果攻擊者偽造數(shù)據(jù)制造出假警報(bào),必將造成急救資源的浪費(fèi)。而如果攻擊者能夠篡改心跳數(shù)據(jù),當(dāng)受害者心臟病突然發(fā)作時(shí),系統(tǒng)可能無法監(jiān)控到異常從而無法做出回應(yīng),受害者的人身安全必然受到嚴(yán)重威脅。
3. 個(gè)人隱私面臨更多的風(fēng)險(xiǎn)
匿名化處理后的數(shù)據(jù),在配合上其他維度的數(shù)據(jù)后,依然可以識別出用戶身份。例如就算把數(shù)據(jù)記錄中的姓名、身份證號等能夠直接識別出某個(gè)個(gè)體的信息隱去,但如果有其他維度的帶有個(gè)體標(biāo)識信息的數(shù)據(jù)集合做參考,那么依然能識別出這些匿名化的數(shù)據(jù)記錄多對應(yīng)的個(gè)體。
現(xiàn)實(shí)中的例子有很多,比如Netflix對數(shù)據(jù)做了匿名化處理,但這些數(shù)據(jù)中的用戶依然可以被識別出來,因?yàn)槠渲幸恍┯脩敉瑫r(shí)在Netflix和IMDB上給相同的電影做了評分,故而只需把這些數(shù)據(jù)關(guān)聯(lián)起來就能達(dá)到識別用戶的目的。
4. 高價(jià)值數(shù)據(jù),本身就是被攻擊的目標(biāo)
大數(shù)據(jù)所收集的原始數(shù)據(jù)往往單位價(jià)值密度低,但經(jīng)過大數(shù)據(jù)處理后能夠提取出這些數(shù)據(jù)中高價(jià)值的部分。這些經(jīng)過處理后的數(shù)據(jù)除了可用于觸發(fā)后續(xù)業(yè)務(wù)邏輯,也是輔助企業(yè)進(jìn)行業(yè)務(wù)決策的重要輸入。與此同時(shí)也是攻擊者們天然感興趣,千方百計(jì)想要獲取到的數(shù)據(jù)。
從攻擊者的角度來看,這些存儲著高價(jià)值數(shù)據(jù)的系統(tǒng)其本質(zhì)上不外乎也是個(gè)應(yīng)用程序,如果能攻破這些應(yīng)用程序進(jìn)而拿到數(shù)據(jù),相比于攻擊者自己收集原始數(shù)據(jù)再處理而言要?jiǎng)澦愕枚唷?/span>
再加上大多數(shù)企業(yè)在防御攻擊這件事上面主要依靠的是基于網(wǎng)絡(luò)隔離的防御方式,意味著應(yīng)用程序本身的安全質(zhì)量極可能是靠不住的,一旦攻擊者侵入企業(yè)內(nèi)網(wǎng),這些存儲著高價(jià)值數(shù)據(jù)的應(yīng)用程序勢必會變成任攻擊者宰割的“羔羊”。
5. 防火防盜防內(nèi)鬼
“防火防盜防內(nèi)鬼”可不是隨便說說的段子。無論是大數(shù)據(jù)系統(tǒng)中的巨量原始數(shù)據(jù),還是經(jīng)過處理后的高價(jià)值數(shù)據(jù),它們不僅是外部攻擊者眼中的肥肉,也可能被內(nèi)鬼盯上。
永遠(yuǎn)不要低估了企業(yè)內(nèi)部威脅,見諸報(bào)端的企業(yè)內(nèi)鬼作案不在少數(shù),就在1個(gè)多月前,特斯拉指控一名前員工泄露了特斯拉機(jī)密數(shù)據(jù),聲稱該員工定期將特斯拉的數(shù)據(jù)輸出給公司以外的人。明星獨(dú)角獸企業(yè)出的事情更容易被傳播報(bào)道出去,相信還有更多不為人知的案例已經(jīng)或者正在發(fā)生,只不過不為公眾所知而言。
總結(jié):“數(shù)據(jù)”是網(wǎng)絡(luò)的“血液”,是企業(yè)得以發(fā)展的核心。大數(shù)據(jù)建設(shè)和大數(shù)據(jù)安全建設(shè)需同步開展。加強(qiáng)重要數(shù)據(jù)基礎(chǔ)設(shè)施保護(hù),建立大數(shù)據(jù)安全的保護(hù)體系,這需要國家、科研機(jī)構(gòu)、企業(yè)三方共同努力,加大投入堅(jiān)持自主創(chuàng)新和自主可控,推進(jìn)大數(shù)據(jù)安全技術(shù)標(biāo)準(zhǔn)化。