干貨 | 互聯(lián)網(wǎng)廣告數(shù)據(jù)的匿名化方案研究
第一部分:背景介紹一、匿名化必要性
互聯(lián)網(wǎng)廣告具有非常重要的商業(yè)價值,同時也是涉及數(shù)據(jù)處理十分密集的行業(yè),出現(xiàn)了操作規(guī)范化、個人信息保護和商業(yè)數(shù)據(jù)安全等一系列問題和挑戰(zhàn),而個保法中規(guī)定個人信息匿密化后不再屬于個人信息,則為平衡個人信息保護和數(shù)據(jù)利用提供了一個窗口。二、匿名化困境
匿密化的概念已經(jīng)被廣泛提及,但是有關(guān)匿密化的標準仍然存在很多爭議,甚至有學者認為應當廢除匿名化的概念。網(wǎng)安法和個保法中以法律的形式確立了匿密化制度,真正有意的討論應該是如何將匿名化制度落實到個人信息保護實踐中去。為此,我們的方案首先從法律法規(guī)、司法實踐理論等多個維度進行調(diào)研來試圖回應這個問題,然后再針對互聯(lián)網(wǎng)廣告領(lǐng)域的數(shù)據(jù)利用的困境來提出匿密化的方案。第二部分:匿名化現(xiàn)狀調(diào)研一、法律法規(guī)國家標準
在法律法規(guī)標準方面,不同國家采用不同的概念,我國相對折中,對于“去標識化”和“匿名化”進行了區(qū)分,其中操作性更強的去標識化已經(jīng)有了實施或者將要實施的國家標準。二、匿名化技術(shù)
在匿名化技術(shù)方面,我們認為匿密化可以視為去標識化的一種極端形態(tài),所以二者采用的技術(shù)是相通的。三、司法實踐
在司法實踐方面,個保法實施剛滿一年,有關(guān)匿名化直接的指導案例還沒有,從中有兩處發(fā)現(xiàn):其一,可以以間接識別性為匿名化處理提供指引,是否達到了匿名化程度,處理后的信息是否具有可識別性;其二,法院通常會結(jié)合場景對于可識別性進行動態(tài)的判斷。四、法律實證研究
在法律實證研究方面,匿名化具有動態(tài)性的特征,學者們也試圖提出匿名化的方案或者標準。第三部分:互聯(lián)網(wǎng)廣告調(diào)研一、法規(guī)與標準
國家目前已經(jīng)明確平臺可以通過用戶個人信息來進行用戶畫像,并進行定向的廣告投放。在標準方面,《移動互聯(lián)網(wǎng)應用程序(App)收集個人信息基本要求》中提出了App收集個人信息的基本要求,并給出常見服務類型必要個人信息范圍以及使用要求,有較大的參考價值。同時,在互聯(lián)網(wǎng)廣告領(lǐng)域也有一批標準已經(jīng)發(fā)布或正在制定,其中與我們選題直接相關(guān)的是《互聯(lián)網(wǎng)廣告數(shù)據(jù)匿名化實施指南》,該行業(yè)標準目前處于報批稿的狀態(tài)。二、企業(yè)案例
三、數(shù)據(jù)采集與個性化推送
不同平臺的用戶畫像因為服務類型不同,收集的數(shù)據(jù)也存在差異。數(shù)據(jù)量和數(shù)據(jù)類型十分廣泛,甚至存在在設備應用程序間追蹤用戶行為的代碼,這些雖然有利于提高用戶畫像的精確度,廣告投放的準確度,同時也帶來了正當性、合法性的問題,Twitter因此收到了巨額的罰款。四、匿名化積極嘗試
在匿名化方向上,互聯(lián)網(wǎng)企業(yè)也在采用積極的策略,比如多方安全計算、差分隱私等技術(shù)來提高廣告數(shù)據(jù)的安全性。第四部分:匿名化方案一、數(shù)據(jù)類型化研究數(shù)據(jù)收集使用限制
互聯(lián)網(wǎng)廣告投放業(yè)務一般屬于“定向推送”類擴展功能服務,收集的數(shù)據(jù)可以分為用戶數(shù)據(jù)類和業(yè)務數(shù)據(jù)類兩類。前者是指用戶直接向平臺提供的數(shù)據(jù),后者可以進一步分為業(yè)務觀測數(shù)據(jù)和業(yè)務推測數(shù)據(jù)。
在明確數(shù)據(jù)類型的基礎(chǔ)上,需要對數(shù)據(jù)收集、使用進行限制,具體可以分為原則性的要求、個人敏感信息的限制、用戶同意以及用戶畫像屬性的限制。二、匿名化應用選擇指引匿名化評估標準
我們的匿名化方案基于場景動態(tài)的匿名化策略,首先根據(jù)前面提到的數(shù)據(jù)類型,以及是否與第三方共享形成表中所示的映射關(guān)系,例如與第三方共享的數(shù)據(jù)采用的標準更為嚴格。具體這些標準如何確定,還與匿密化模型選擇有關(guān),如K模型和差分隱私模型的評價指標不同。我們還建議平臺對匿密化方案至少每半年進行一次重新評估,根據(jù)政策法規(guī)要求和技術(shù)發(fā)展變化來規(guī)劃相關(guān)的策略,以實現(xiàn)數(shù)據(jù)合規(guī),并控制實際損害和可能風險。右邊是具體的匿名化流程,以技術(shù)保障評估規(guī)制過程控制,來確保匿名化過程的有序進行。
我們的目的并不在于證明數(shù)據(jù)完全是不可識別的,而在于通過定期的動態(tài)評估模式來確保數(shù)據(jù)風險,評估工作主要從技術(shù)和合規(guī)兩個維度展開,在技術(shù)評估方面包含靜態(tài)基于重標識風險的分級的評估和動態(tài)基于攻擊者攻擊測試評估。以上就是我們整個報告的內(nèi)容!
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。







