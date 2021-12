「我們是靠後設資料來殺人。」



2014年4月,在約翰霍普金斯大學(Johns Hopkins University)的「重新評估國安局」(Re-evaluating the NSA)小組辯論中,麥可.海登(Michael Hayden)將軍發表了這則令人大吃一驚的聲明。海登將軍曾兼任國家安全局和中央情報局的前局長,所以毋庸置疑,他知道自己在說什麼。

靠後設資料來致死怎麼有可能?雖然從暗殺(Assassinations)到殭屍藝術(Zombie art)的任何事,或可由藝術與建築索引典(Art & Architecture Thesaurus)來描述,但沒有人會憑控制詞彙來殺死任何人。

答案是,後設資料能大舉揭底。尤其是被稱為使用性後設資料的後設資料類型,掌握了大量關於個人和個人行為的資料。另外,使用性後設資料不但能揭露關於個人的資訊,還能提供關於社群網路,以及個人、地點和組織之間連結的豐富資料。人類是群居動物,所以在描述人時,幾乎無可避免到頭來就會是描述此人與他人的關係。從第二章非常簡短的一探網路分析中應該很清楚的就是,一旦開始討論關係,就是在討論網路。

遊戲「凱文.貝肯的六度分隔」(The Six Degrees of Kevin Bacon)提供了耍蠢但卻一目瞭然的例子。這個遊戲的目標是從任何一位演員開始,在六步以內把他連結到凱文.貝肯,步驟則是以在電影裡與誰同框來定義。例如馬科斯.斯萊克(Max Schreck,曾在1922年的默片《吸血鬼諾斯費拉圖》[Nosferatu]裡,扮演吸血鬼歐洛克伯爵〔Count Orlok〕)在《抵制》(Boykott)裡,跟沃夫岡.齊爾澤(Wolfgang Zilzer)同框,他在《愛到發燒》(Lovesick)裡,跟伊麗莎白.麥高文(Elizabeth McGovern)同框,她在《天下父母心》(She’s Having a Baby)裡,跟凱文.貝肯同框,於是給馬科斯.斯萊克的貝肯數,便是低到令人訝異的「三」。遊戲「凱文.貝肯的六度分隔」顯而易見是源自於六度分隔理論(Six Degrees of Separation),靠著同名的舞台劇和電影而聲名大噪,講的是世界上的任何人,都能透過不超過另外六個人來連結到其他任何人,只要你能識別出正確的六個(六度分隔理論受到史丹利.米爾格蘭(Stanley Milgram)在1967年的小世界實驗〔small world experiment〕所影響,它是社群網路首批的實證研究之一)。

這個觀念的變體相當常見。另一個風行的例子是艾狄胥數,得名自協作與合著論文非常廣的數學家保羅.艾狄胥(Paul Erdős)。艾狄胥的合著者(有511人)具有的艾狄胥數是「一」,他們的合著者具有的艾狄胥數是「二」(9,267人),依此類推。(好玩的是,保羅.艾狄胥具有的貝肯數是四,因為他是紀錄片《N是數字》[N Is a Number]的受測者。不過,凱文.貝肯具有的艾狄胥數則是無限大,意謂著沒有連結,因為凱文.貝肯從來沒發表過數學論文。)

使「凱文.貝肯的六度分隔」和計算某人的艾狄胥數成為可能的圖,相當簡單:這些圖中的節點是演員或數學家,邊緣是「在電影裡同框」或「合著論文」。臉書採取了這個把社群網路大幅簡化的觀念,並以此來建立營業模式。臉書中的節點是人、地、事,邊緣是「好友」和「讚」,於是就使臉書的社群圖稍微比貝肯或艾狄胥圖要來得複雜,但仍是現實的簡化版。

想像一下,社群圖實際上是企圖掌握人際關係在實體世界中的複雜性。節點仍會是人、地、事,但或許會各有類目:城市、歌曲、建物、食品,諸如此類。邊緣或許會有範圍廣泛的值:在人與人之間,你或許有好友、熟人、手足、父母、配偶、鄰居、同僚、雇主、員工等等;在人與地之間,你或許有居住、居住過、出生、工作、念過大學等等。可能性並非無限,但肯定是非常多,因為人類行為與關係的樣式非常多。

在建立社群網路,企圖把節點分類和標註邊緣時,企圖去詳盡掌握人、事和關係的每種樣式,八成會徒勞無功,因為它是太大的集合。至關重要的任務是要決定,就你企圖創造的網路而言,節點的重要類目和邊緣的標註是什麼。在「凱文.貝肯的六度分隔」中,這些非常簡單,使任何人玩起遊戲來都很容易。臉書則稍微比較複雜,節點和邊緣的樣式較多。但臉書有軟體介面來對你呈現這些選項,還有幕後的演算法來為你管理網路。這些是臉書的重要特色,以及網路普遍的重點:網路愈複雜,在它的管理、尤其是分析上涉及運算,就愈至關重要。羅賓.鄧巴(Robin Dunbar)率先發現,靈長類腦部的大小與該物種平均社群團體的規模有相關性。依照這些發現,鄧巴提出就人類個體的社群圈而言,也就是人可以保持穩定社群關係,並了解每個人與其他每個人關係的人數,最大的規模約為150。後來研究人員對此數目有所辯論,但估計不會比250要高出多少。總之,人類所能記住的社群網路頗大,只要我們是內嵌在那個網路裡,但要分析更大的網路或自身社群界以外的網路,就必須靠運算了。

這就帶我們回到了海登將軍。對於他所指稱的後設資料類型,我們在殺人時所靠的後設資料,正是這類關於個人及其所內嵌網路的資料。

關於這點的完整資訊很難取得。愛德華.史諾登對媒體釋出了為數眾多,關於國安局監視計畫的機密文件,但即使如此,這些文件(在本文撰寫之際)並非全都很容易取得,來讓尋常百姓審視。話雖如此,對於情報圈在蒐集和使用其他來源的後設資料上,還是有可能統整出像樣的了解。

國安局所蒐集關於電話通聯的後設資料,是直接來自電話業者。如本書在一開頭所討論,這是相當多的後設資料:撥打者和接聽者的電話號碼,通聯的時間和長度,撥打者和接聽者的位置等等。假如國安局有理由相信,特定的電話號碼是跟「涉嫌人」相關,就能去查詢電話後設資料的資料庫,以識別涉嫌電話所打過的號碼,以及那些電話所打過的號碼。

對任何自重的情報分析人員來說,光是誰打給誰當然並不足夠。但電話通聯網就是社群網路,能用來充實國安局想必也有維護的其他社群網路資料。這個社群網路中的實體(也就是節點)所包括的東西,像是電話號碼、電子郵件位址和IP位置,想必還有個人、地理位置,以及好比說銀行等組織。在史諾登案的故事裡,諸多新聞單位報導過這個網路中的邊緣所包括的關係,好比說雇用、一同前往和發送論壇訊息。你可以去想像邊緣的其他標註,好比說通聯、寄電子郵件給、前往和造訪

海登將軍說我們是靠後設資料來殺人時,所意謂的是什麼?就是這點:根據美國情報圈目前所規定的舉證責任,用關於社群網路和個人在其中的地位的後設資料,加上關於個人行動的後設資料,就對該個人採取軍事行動來提供夠多的成立資訊。



