
提高數據庫安(ān)全性的十一項技(jì )術
編輯:2021-07-30 09:25:27
數據庫不應成為(wèi)危及安(ān)全和隐私的“切入口”,以下技(jì )術可(kě)以幫助降低數據庫安(ān)全風險并确保合規性。
數據庫中(zhōng)含有(yǒu)大量個人信息,甚至包含一些敏感信息,為(wèi)管理(lǐ)這些數據的公(gōng)司帶來了不少麻煩。現在,複雜的工(gōng)具(jù)和技(jì )術使得數據庫開發人員可(kě)以通過保持信息的私密性來整體(tǐ)提升數據庫的安(ān)全性。
這些解決方案主要取決于對數學(xué)的巧妙應用(yòng)。例如,一些最簡單的機制看起來隻是現代版本的密碼,本質(zhì)上是經典解碼輪的數字版本。其他(tā)更複雜的擴展,也進一步推動數學(xué)提供更多(duō)的靈活性和功能(néng)性。許多(duō)在實驗室中(zhōng)試驗了幾十年的技(jì )術想法最終得到了研發和應用(yòng),成為(wèi)了現實。
這些算法正在成為(wèi)鞏固業務(wù)關系和确保準确“無欺詐”工(gōng)作(zuò)流程的基礎。這些方法使公(gōng)司可(kě)以更輕松地向客戶提供個性化服務(wù),同時保護他(tā)們的隐私。此外,這些方法還能(néng)夠在不妨礙服務(wù)交付的情況下更好地遵守管理(lǐ)數據流的法規。
以下是讓數據庫變得更安(ān)全、更簡單的11 種工(gōng)具(jù)和技(jì )術:
有(yǒu)時候,最簡單的解決方案就足夠了。現代加密算法用(yòng)一把鑰匙加密數據,因此隻有(yǒu)擁有(yǒu)鑰匙的人才能(néng)讀取數據。許多(duō)數據庫可(kě)以使用(yòng)AES等标準加密數據。這些解決方案最能(néng)防止硬件丢失(也可(kě)能(néng)是被盜)的情況,因為(wèi)如果沒有(yǒu)正确的加密密鑰,數據仍然是安(ān)全的。
但是,這種基礎加密并非一勞永逸的方法。如果攻擊者能(néng)夠侵入計算機,對稱加密算法對運行中(zhōng)的計算機的保護程度也是有(yǒu)限的。攻擊者可(kě)以找到允許數據庫處理(lǐ)合法操作(zuò)的相同密鑰。許多(duō)數據庫提供了對“靜止”信息進行加密的選項。
這種技(jì )術以不同的方式部署數學(xué)。它沒有(yǒu)将信息鎖定在數字保險箱中(zhōng),而是添加了精(jīng)心調整的噪音量,以使其難以确定哪條記錄對應哪個特定的數據個體(tǐ)。如果噪聲數值正常,那麽便不會影響整體(tǐ)統計數據,如平均值。也就是說,如果您從數據集中(zhōng)的年齡随機增加或減少幾年,平均年齡将保持不變,但這樣一來可(kě)能(néng)很(hěn)難通過年齡尋找到特定個人。
該解決方案的效用(yòng)各不相同。最好将數據集發布給想要研究數據的不受信任的合作(zuò)夥伴,通常是通過計算數據平均值和數據集的大小(xiǎo)。在某種程度上來說,許多(duō)算法添加噪聲做得很(hěn)好,因為(wèi)他(tā)們不會扭曲許多(duō)聚合的統計數據。目前,了解哪些機器學(xué)習算法仍然可(kě)以很(hěn)好地處理(lǐ)失真位是一個非常活躍的研究領域。
這些計算有(yǒu)時被稱為(wèi)“消息驗證代碼”或“單向函數”,它将大文(wén)件歸結為(wèi)較小(xiǎo)的數字,從而使其實際上幾乎無法逆轉。給定一個特定的結果或代碼,找到将生成該特定代碼的文(wén)件将花(huā)費太長(cháng)時間。
哈希函數是區(qū)塊鏈的重要組成部分(fēn),它以一種可(kě)跟蹤和識别篡改的方式将它們應用(yòng)于數據的所有(yǒu)更新(xīn)中(zhōng)。這可(kě)以防止加密貨币交易中(zhōng)的欺詐行為(wèi),并且許多(duō)人正在将這些技(jì )術應用(yòng)于需要确保數據一緻的其他(tā)數據庫。添加哈希函數可(kě)以幫助企業應對數據合規性挑戰。
美國(guó)國(guó)家标準與技(jì )術研究院(NIST)的安(ān)全散列算法(SHA)是廣泛使用(yòng)的标準集合。一些早期版本(如SHA-0和SHA-1)具(jù)有(yǒu)已知的漏洞,但較新(xīn)的版本(如SHA-2和SHA-3)則被認為(wèi)非常安(ān)全。
像RSA或DSA這樣的數字簽名(míng)算法算是更為(wèi)複雜的計算,它将散列函數的篡改檢測特性與帶有(yǒu)認證信息的特定個人或機構相結合。它們依賴一個隻有(yǒu)責任方知道的秘密密鑰。例如,加密貨币将财富的所有(yǒu)權與知道正确密鑰的人聯系起來。跟蹤個人責任的數據庫可(kě)以包括驗證特定交易的數字簽名(míng)。
簡明的非交互式知識論證(SNARK)是一種更為(wèi)複雜的數字簽名(míng)版本,可(kě)以證明複雜的個人信息而不會洩露信息本身。這種技(jì )巧依賴于更複雜的數學(xué),有(yǒu)時被稱為(wèi)“零知識證明”(ZKP)。
包含SNARK和其他(tā)類似證明的數據庫可(kě)以保護用(yòng)戶的隐私,同時确保自己合規性。例如,一個非常簡單的例子可(kě)能(néng)就是數字駕駛執照,它可(kě)以證明一個人的年齡能(néng)夠飲酒而又(yòu)不會透露他(tā)們具(jù)體(tǐ)的出生日期。一些人正在研究将該技(jì )術應用(yòng)于疫苗護照。
SNARK和其他(tā)非交互式證明同樣屬于研究熱門。使用(yòng)各種編程語言的數十種算法實現也為(wèi)新(xīn)項目奠定了良好的基礎。
處理(lǐ)使用(yòng)傳統加密算法鎖定的數據的唯一方法是對其進行解密,這個過程可(kě)以将其暴露給任何有(yǒu)權訪問計算機進行工(gōng)作(zuò)的人。同态加密算法旨在使對加密信息進行計算而無需對其進行解密成為(wèi)可(kě)能(néng)。最簡單的算法允許進行一次算術運算,例如将兩個加密數字相加。更複雜的算法可(kě)以進行任意計算,但速度通常要慢得多(duō)。為(wèi)特定問題尋找最有(yǒu)效的方法也是一個熱門的研究領域。
一些開發人員将他(tā)們的數據集拆分(fēn)成更小(xiǎo)的部分(fēn),有(yǒu)時甚至出奇得小(xiǎo),然後将它們分(fēn)發到許多(duō)獨立的計算機中(zhōng)。有(yǒu)時這些位置會被打亂,因此無法預測哪台計算機将保存哪條記錄。該解決方案主要用(yòng)于軟件包,這些軟件包旨在通過并行運行搜索或分(fēn)析算法來加速所謂的大數據工(gōng)作(zuò)。最初的目的是速度,但也可(kě)能(néng)導緻增加攻擊彈性的副作(zuò)用(yòng)。
如果将一個數據集拆分(fēn)成幾塊可(kě)以保護隐私,那麽為(wèi)什麽不是十億塊或更多(duō)塊呢(ne)?更常見的解決方案是将數據直接存儲在創建和使用(yòng)的位置。用(yòng)戶的智能(néng)手機通常具(jù)有(yǒu)大量額外的計算力和存儲空間。如果幾乎不需要集中(zhōng)分(fēn)析和處理(lǐ)功能(néng),那麽避免将其傳送到雲服務(wù)器處理(lǐ)速度會更快、更具(jù)成本效益。
一些研究人員正在通過随機生成新(xīn)值來創建純合成的數據集,但其方式遵循相同的模式并且在統計上基本相同。
一些研究人員正在構建工(gōng)具(jù)來限制數據收集,并在存儲數據之前對數據進行預處理(lǐ)。
無狀态計算是大部分(fēn)網絡的基礎,當以盡可(kě)能(néng)少的記錄保存方式重新(xīn)構建工(gōng)作(zuò)時,許多(duō)高效驅動器都能(néng)夠發揮效用(yòng)。在某些極端情況下,如果合規性允許,并且用(yòng)戶願意接受極少(甚至沒有(yǒu))得個性化服務(wù)時,删除數據庫可(kě)以最大程度地保護用(yòng)戶隐私。



咨詢熱線(xiàn):0351-4073466
地址:(北區(qū))山(shān)西省太原市迎澤區(qū)新(xīn)建南路文(wén)源巷24号文(wén)源公(gōng)務(wù)中(zhōng)心5層
(南區(qū))太原市小(xiǎo)店(diàn)區(qū)南中(zhōng)環街(jiē)529 号清控創新(xīn)基地A座4層
