區塊鏈大數據隱私
1. 區塊鏈如何帶來個人數據保護「革命」
區塊鏈如何帶來個人數據保護「革命」
美國媒體當地時間17日晚間披露說,深陷濫用個人隱私數據丑聞的英國「劍橋分析」公司原本計劃推出個人隱私數據存儲服務,並通過區塊鏈技術以加密貨幣的形式出售。個人信息加密貨幣化的概念其實並不新鮮,這個設想的關鍵在於每個人對個人信息的自主權。一些業內人士認為,區塊鏈技術可能帶來個人數據保護「革命」。
大數據時代,個人的數據被認為是黃金般珍貴。個人數據泄漏令人擔憂,但絕大部分人不可能因為害怕數據被收集而切斷與互聯網的聯系,而現階段有責任保管個人信息的企業、學校、酒店、社交網站等往往擔責不力。專家們認為,區塊鏈技術作為一種帶有加密、信任、點對點、難篡改等特徵的「中間件」,有望解決這個難題。
區塊鏈技術的出現令個人數據掌控權從互聯網公司轉移到用戶自己手中,使人人掌控自己的個人數據成為可能。通過它,用戶個人數據可以與個人數字身份證相關聯,用戶可以選擇數字身份證是匿名、化名或公開,還可以隨時隨地從任何設備訪問區塊鏈應用平台,控制他們的互聯網個人數據。
舉例來說,某人的身份證號碼在區塊鏈上的信息可能被轉換為一串密文,人臉圖像信息也被加密。他在酒店辦理入住時,僅需通過應用將身份證號碼密文發送給酒店,酒店將信息同區塊鏈應用上的加密數據比對,不需要知道他的任何真實信息,但只要加密數據比對結果相符就可以保證入住。
與此同時,大數據及人工智慧開發需要大量用戶數據資源,用戶可以將個人數據作為加密貨幣選擇性出售,同時收到一定回報。例如,如果電商需要用戶數據開發一個新應用,用戶可以選擇出售自己的購物歷史數據,但自己的地址賬號等信息仍可以保密。
在基因測序領域,區塊鏈應用已經開始讓傳統基因測序公司出售個人數據的「生財之道」受到挑戰。
近年來,面向普通人的基因測序服務備受追捧。以美國「23與我」染色體生物技術公司為例,消費者僅需不到100美元和幾口唾液就能得到家族遺傳信息,如果再付80美元,就能在原始數據基礎上獲得遺傳健康風險等方面的深度解析。然而這家企業並不滿足於測序服務收入,還將自己掌握的數百萬份客戶遺傳數據分類打包賣給制葯公司,僅2015年初出售的帕金森病數據就高達6000萬美元。不少類似的生物技術公司一邊從消費者獲得服務收入,一邊轉賣消費者的數據「掙雙份錢」。
今年2月,美國哈佛大學遺傳學家喬治·徹奇創建了「星雲基因」公司,希望通過區塊鏈技術打破這個格局。該公司計劃以低於1000美元的價格完成全基因組測序,這一費用由客戶承擔,作為回報,客戶在直觀了解自身遺傳信息對應疾病風險的同時,也擁有對測序數據的自主權。遺傳信息將通過區塊鏈技術保障安全,同時加密貨幣化,按照顧客的意願進行存儲出售等交易。
這家公司計劃推出一種「星雲幣」作為交易媒介,顧客可以將自己的遺傳信息兌換為「星雲幣」,也可以用「星雲幣」支付自己的測序費用,制葯公司可以用傳統貨幣購買「星雲幣」來獲得普通人的遺傳信息數據,整個交易買賣過程都通過區塊鏈平台完成,加密透明且安全。
徹奇表示,在綜合測序花費、遺傳信息保護、數據管理及基因組大數據處理等多方面因素後,區塊鏈技術讓更多人真正地「擁有」自己的遺傳信息。
2. 什麼是區塊鏈大數據怎麼解釋
數據區塊鏈技術本質是去中心化且寓於分布式結構的數據存儲、傳輸和證明的方法,用數據區塊取代了目前互聯網對中心伺服器的依賴,使得所有數據變更或者交易項目都記錄在一個雲系統之上,理論上實現了數據傳輸中對數據的自我證明,深遠來說,這超越了傳統和常規意義上需要依賴中心的信息驗證範式,如金窩窩集團的區塊鏈+大數據極大的降低了全球」信用」的建立成本,這種點對點驗證將會產生一種」基礎協議」,是分布式人工智慧的一種新形式。
3. 區塊鏈與大數據存儲究竟有著怎樣的關系
區塊鏈和大數據存儲的關系如下:
一、數據安全:區塊鏈讓數據真正「放心」流動起來
區塊鏈以其可信任性、安全性和不可篡改性,讓更多數據被解放出來。用一個典型案例來說明,即區塊鏈是如何推進基因測序大數據產生的。區塊鏈測序可以利用私鑰限制訪問許可權,從而規避法律對個人獲取基因數據的限制問題,並且利用分布式計算資源,低成本完成測序服務。區塊鏈的安全性讓測序成為工業化的解決方案,實現了全球規模的測序,從而推進數據的海量增長。
二、數據開放共享:區塊鏈保障數據私密性
政府掌握著大量高密度、高價值數據,如醫療數據、人口數據等。政府數據開放是大勢所趨,將對整個經濟社會的發展產生不可估量的推動力。然而,數據開放的主要難點和挑戰是如何在保護個人隱私的情況下開放數據。基於區塊鏈的數據脫敏技術能保證數據私密性,為隱私保護下的數據開放提供了解決方案。數據脫敏技術主要是採用了哈希處理等加密演算法。例如,基於區塊鏈技術的英格碼系統(Enigma),在不訪問原始數據情況下運算數據,可以對數據的私密性進行保護,杜絕數據共享中的信息安全問題。例如,公司員工可放心地開放可訪問其工資信息的路徑,並共同計算出群內平均工資。每個參與者可得知其在該組中的相對地位,但對其他成員的薪酬一無所知。
數據HASH脫敏處理示意圖
三、數據存儲:區塊鏈是一種不可篡改的、全歷史的、強背書的資料庫存儲技術
區塊鏈技術,通過網路中所有節點共同參與計算,互相驗證其信息的真偽以達成全網共識,可以說區塊鏈技術是一種特定資料庫技術。迄今為止我們的大數據還處於非常基礎的階段,基於全網共識為基礎的數據可信的區塊鏈數據,是不可篡改的、全歷史的、也使數據的質量獲得前所未有的強信任背書,也使資料庫的發展進入一個新時代。
四、數據分析:區塊鏈確保數據安全性
數據分析是實現數據價值的核心。在進行數據分析時,如何有效保護個人隱私和防止核心數據泄露,成為首要考慮的問題。例如,隨著指紋數據分析應用和基因數據檢測與分析手段的普及,越來越多的人擔心,一旦個人健康數據發生泄露,將可能導致嚴重後果。區塊鏈技術可以通過多簽名私鑰、加密技術、安全多方計算技術來防止這類情況的出現。當數據被哈希後放置在區塊鏈上,使用數字簽名技術,就能夠讓那些獲得授權的人們才可以對數據進行訪問。通過私鑰既保證數據私密性,又可以共享給授權研究機構。數據統一存儲在去中心化的區塊鏈上,在不訪問原始數據情況下進行數據分析,既可以對數據的私密性進行保護,又可以安全地提供給全球科研機構、醫生共享,作為全人類的基礎健康資料庫,對未來解決突發疾病、疑難疾病帶來極大的便利。
五、數據流通:區塊鏈保障數據相關權益
對於個人或機構有價值的數據資產,可以利用區塊鏈對其進行注冊,交易記錄是全網認可的、透明的、可追溯的,明確了大數據資產來源、所有權、使用權和流通路徑,對數據資產交易具有很大價值。
一方面,區塊鏈能夠破除中介拷貝數據威脅,有利於建立可信任的數據資產交易環境。數據是一種非常特殊的商品,與普通商品有著本質區別,主要是具有所有權不清晰、 「看過、復制即被擁有」等特徵,這也決定了使用傳統商品中介的交易方式無法滿足數據的共享、交換和交易。因為中介中心有條件、有能力復制和保存所有流經的數據,這對數據生產者極不公平。這種威脅僅僅依靠承諾是無法消除的,而這種威脅的存在也成為阻礙數據流通巨大障礙。基於去中心化的區塊鏈,能夠破除中介中心拷貝數據的威脅,保障數據擁有者的合法權益。
另一方面,區塊鏈提供了可追溯路徑,能有效破解數據確權難題。區塊鏈通過網路中多個參與計算的節點來共同參與數據的計算和記錄,並且互相驗證其信息的有效,既可以進行信息防偽,又提供了可追溯路徑。把各個區塊的交易信息串起來,就形成了完整的交易明細清單,每筆交易來龍去脈非常清晰、透明。另外,當人們對某個區塊的「值」有疑問時,可方便地回溯歷史交易記錄進而判別該值是否正確,識別出該值是否已被篡改或記錄有誤。
一切在區塊鏈上有了保障,大數據自然會更加活躍起來。
幣盈中國平台上眾籌項目的代幣都是基於區塊鏈技術開發出來的,相關的信息都會記錄到區塊鏈上。
4. 區塊鏈會不會暴露我們的隱私
答案是當然不會。區塊鏈系統所要保存的東西也是有針對性的
5. 區塊鏈技術與大數據之間的關系是什麼
重慶金窩窩分析區塊鏈技術與大數據之間的關系如下:
區塊鏈和大數據關系並不是很大。大數據主要的是對於海量數據進行管理,而區塊鏈的核心是在沒有中心化中介計入的情況下實現數據的高安全性和高可靠性。
所以區塊鏈和大數據並不互相沖突,也不會取代,完全是面對不同場景情況下對於數據的不同解決方案。
6. 請問區塊鏈和大數據之間有什麼樣的關系
區塊鏈和大數據都是熱門的話題,大數據的發展早於區塊鏈,目前已經成為了一個龐大的產業,而將發展中的區塊鏈技術與大數據相結合,就會碰撞出不一樣的效應。從技術角度看,大數據技術用信任換取了計算資源,而區塊鏈技術用計算資源換取了信任,所以兩者的結合就掀起了信息安全的新浪潮。基於區塊鏈分布式數據存儲、去中心化、不可篡改、可追溯、可信任等特性,重慶金窩窩網路科技集團組建了強大的區塊鏈研究團隊,專業提供以區塊鏈為底層技術的大數據服務。
7. 區塊鏈隱私關鍵技術研究
在數字化浪潮推動下,數據領域的技術創新、場景應用與管理服務日益成為各個行業領域數字化轉型發展的重要驅動力。同時,「數據流通」與「數據安全」間的矛盾也日益升級,成為影響數字化發展的制約因素。
安全VS發展
「安全」與「發展」,一直是數據管理領域的兩大重要主題。二者既矛盾對立,相互制約;又在不斷的技術創新下追尋均衡,最大限度實現數據的價值。
矛盾制約
「數據」作為一種特殊的市場資源與生產要素,其自身特點決定只有在更大范圍的社會共享中才能發揮其真正的資源價值。在人工智慧、大數據、雲計算等技術快速應用推廣的當下,不斷提高的算力+不斷優化的演算法,將通過不同維度、不同領域的大數據發現事物間蘊藏的規律,並運用規律解釋過去、預測未來。
智能演算法持續優化、提升的重要前提即是通過海量、多元的大數據資源進行數據訓練,客觀上有著較強的數據共享使用需求,這與具有「信息數據共享和透明」特點的區塊鏈技術不謀而合,相輔相成,因此近年來區塊鏈技術發展應用迅速。但需要注意的是,數據的共享交換雖然提升了數據自身價值,但也不可避免的出現侵犯數據所有者「數據隱私」的安全問題,數據共享挖掘面臨合規監管,數據技術發展應用陷入瓶頸。
均衡發展
「在矛盾中尋找平衡」,是目前數據領域技術創新應用的重要課題。客觀市場環境的快速變化也為「數據流通」與「數據安全」的均衡發展形成強大驅動力。
2019年末,一場突如其來的新型冠狀病毒疫情在世界范圍內蔓延肆虐,大量民眾不幸罹難,各國經濟發展更是遭受沉重打擊。在客觀疫情防控形勢下,「數字化轉型發展」成為各國恢復經濟秩序和建立全新國際競爭優勢的重要戰略措施。在這樣的背景下,數據作為全新的生產要素,隨著功能價值不斷提升,技術應用不斷拓展,數據的「流通使用」和「安全保障」也日益受到行業發展與政府監管的重視。
數據技術創新應用,一方面對數據安全保障提出了全新挑戰,另一方面也以技術創新形式給出了相應的答案——「區塊鏈+隱私計算」。
區塊鏈+隱私計算
數據時代的信任機制與隱私保護
區塊鏈技術是一種通過去中心化、高信任的方式集體維護一個可靠資料庫的技術方案。由於具有「去中心化」、「分布式數據存儲」、「可追溯性」、「防篡改性」、「公開透明」等優勢特點,區塊鏈技術能夠有效解決數據領域的數據真實性、安全性與開放性問題,通過建立可信任的數據管理環境,防範和避免各類數據造假、篡改、遺失等數據管理問題,促進數據的高效共享與應用。
一如上文所述,區塊鏈技術具有「信息數據共享和透明」的特點,但無論從市場商業競爭角度還是個人信息安全形度來看,都沒有人希望自己的數據完全公開、透明。因此,隱私保護合規成為數據管理領域的一條重要「紅線」,一方面保護著數據所有者的隱私安全,另一方面也影響著數據流通共享的效率與發展。
那麼有沒有一種技術既可以保證信息數據的高效流通共享,卻又不會越過隱私保護合規紅線?
如果說「區塊鏈」技術建立了數據時代的信任機制,那麼「隱私計算」則在數據共享洪流中為數據所有者建立了安全的隱私保護防線。
「隱私計算」,即面向隱私信息全生命周期保護的計算理論和方法,是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統。簡單來說,隱私計算即是從數據的產生、收集、保存、分析、利用、銷毀等環節中對隱私進行保護的技術方法。
同區塊鏈技術一樣,隱私計算並不特指某一門技術,而是一種融合了密碼學、數據科學、經濟學、人工智慧、計算機硬體、軟體工程等多學科的綜合技術應用。隱私計算包括一系列信息技術,如業界較早提出的安全多方計算(MPC)技術、以硬體技術隔離保護為主要特點的可信執行環境(TEE)技術、基於密碼學和分布式計算實現多方協作機器學習的聯邦學習(FL)技術,以及如同態加密、零知識證明、差分隱私等輔助性技術,都屬於隱私計算范疇。
安全多方計算(MPC),是一種在參與方不共享各自數據且沒有可信第三方的情況下安全地計算約定函數的技術和系統。通過安全的演算法和協議,參與方將明文形式的數據加密後或轉化後再提供給其他方,任一參與方都無法接觸到其他方的明文形式的數據,從而保證各方數據的安全。
可信執行環境(TEE),是指CPU的一個安全區域,它和操作系統獨立開來,且不受操作系統的影響。在這個安全區域里保存和計算的數據不受操作系統的影響,是保密且不可篡改的。
聯邦學習(FL),是指在多方在不共享本地數據的前提下,進行多方協同訓練的機器學習方式。聯邦學習技術支持數據不出域,而是讓演算法模型進行移動,通過數據訓練進而優化演算法模型。
隱私計算技術的目的在於讓數據在流通過程中實現「可用不可見」,即只輸出數據結果而不輸出數據本身。這一方面保證了數據所有者的數據所有權不受侵犯,滿足數據流通的合規性;另一方面在隱私保護技術加持下,各方主體擁有的信息數據能夠高效流通使用,不斷擴大數據價值,賦能各個行業領域數據應用。
舉例如在醫療數據領域,各類醫療數據的隱私性要求較高、數據量較大,通常只保存在本地機構的信息系統中,很難實現高效的醫療數據流通、共享與使用,無法為醫療領域的各類病理研究、醫療診斷與技術創新形成數據支持,不利於創新醫療技術研發與應用。
但如果能通過隱私計算技術支持,在保證數據「可用不可見」的前提下,實現不同區域、不同醫療機構醫療數據的高效流通使用,持續優化醫療行業的各類演算法模型,將為實現醫療行業的精準醫療、遠程醫療、智能醫療等醫療技術服務創新形成強力數據支持。
數字化發展浪潮之下,「數據」作為一種全新的重要市場資源與生產要素,其快速發展與管理應用日益受到國家的重視,並不斷賦能各個行業領域發展。同時,數據領域存在的隱私安全問題也令數據管理應用陷入發展困境。可以預見,區塊鏈技術和隱私計算技術的結合,將是數據管理領域一次重要的嘗試探索,對數據領域發展產生重要影響。
8. 如何解釋區塊鏈中大數據的安全性問題
區塊鏈和大數據關系並不是很大。大數據主要的是對於海量數據進行管理,而區塊鏈的核心是在沒有中心化中介計入的情況下實現數據的高安全性和高可靠性。所以區塊鏈和大數據並不互相沖突,也不會取代,完全是面對不同場景情況下對於數據的不同解決方案。
9. 在數據隱私保護方面金窩窩區塊鏈技術有什麼優勢
在數據隱私的保護方面,金窩窩區塊鏈技術將極大地區別於傳統大數據。它將利用區塊鏈獨特的加密方式,保護平台用戶的隱私,杜絕此前部分互聯網名企出現的「隱私泄露」事件。讓用戶體驗良好的服務之餘,對自己的個人信息更加安心。