文/陽 光
眼下,全球最大的社交網(wǎng)站Facebook(臉譜)正值生死存亡之春。因為它在一周前卷入了一場被《權(quán)力的游戲》還要暗黑的諜戰(zhàn)劇中,而且不幸充當(dāng)了暴風(fēng)眼的中心角色。
這場當(dāng)下還在醞釀發(fā)酵的、全球最吸引眼球的諜戰(zhàn)劇,幾乎可以完勝好萊塢歷史一的任何一幕骯臟的政治權(quán)謀劇目,因為它幾乎席卷了這個星球上當(dāng)下最有權(quán)勢的幾個炙手人物:
擁有全球21億用戶(臣民)的社交帝國沙皇Facebook創(chuàng)始人馬克·扎克伯格,美國總統(tǒng)特朗普、俄羅斯總統(tǒng)普京、美國億萬富翁兼頂尖的人工智能專家羅伯特·默瑟(Robert Mercer)、特朗普密友美國前白宮首席戰(zhàn)略師兼總統(tǒng)高級顧問班農(nóng)(SteveBannon)、俄國彼得堡大學(xué)副教授兼英國劍橋大學(xué)高級研究員(Aleksandr Kogan)、最早向英國《衛(wèi)報》爆料的一家名為英國劍橋分析公司的前聯(lián)合創(chuàng)始人懷利(Christopher Wylie),一家在英國劍橋設(shè)立虛假辦公室、“可以玩弄整個國家于鼓掌之間”的大數(shù)據(jù)公司CA(Cambridge Analytica)創(chuàng)始人兼CEO尼克斯(Alexander Nix)……
序幕:頂尖AI科學(xué)家、億萬富翁默瑟博士的出場
首先,請允許筆者花一點點時間,拼貼還原一下這場高科技諜戰(zhàn)劇的主要劇情和時間線索:
劇情最早可以追溯到美國總統(tǒng)特朗普的金主、一位神秘的億萬富翁和頂尖AI科學(xué)家羅伯特·默瑟(Robert Mercer)。
如果說這個世界上總有為數(shù)不多的幾個多金博學(xué)有權(quán)勢的“超強大腦”,默瑟無論如何算得上一個。1972年,他從伊利諾伊大學(xué)香檳分校獲(UIUC)獲得計算機博士學(xué)位之后,加入IBM,成為一位專門從事計算機語言處理的科學(xué)家。在IBM期間,他主導(dǎo)研發(fā)了一種所謂的統(tǒng)計機器翻譯技術(shù)。這種技術(shù)可以分析網(wǎng)絡(luò)文本,將文本中的單詞進(jìn)行分組和聚合,再通過機器的深度學(xué)習(xí)結(jié)合上下文完成自動翻譯。
別忘了,這是默瑟在上世紀(jì)七八十年代就掌握的AI(人工智能)技術(shù),比起AI在2016年前后成為一個流行詞,早了將近半個世紀(jì)。為了表彰他在人工智能領(lǐng)域的成就,默博士雖然離開了計算機界,2014年依舊獲頒ACL(計算機語言學(xué)協(xié)會)的ACL終身成就獎。
默博士的機器翻譯一面世,當(dāng)時就令學(xué)界側(cè)目。1993年默瑟離開了IT界,加盟了一家名為文藝復(fù)興科技(Renaissance Technologies)美國對沖基金公司,身份是聯(lián)席CEO。這家創(chuàng)辦于1982年的對沖基金和傳統(tǒng)基金不同,以“科技智能”聞名業(yè)界,成員都是一大幫數(shù)學(xué)家、計算機科學(xué)家和物理學(xué)家,主打機器算法中的量化交易。
過去20年來,文藝復(fù)興基金的年平均收益率高達(dá)72%,管理基金規(guī)模超650億美元,業(yè)界聲明赫赫,自然與這一大幫“全球超強大腦”的算法相關(guān)。
政治一默博士是最堅定的右翼,作為華盛頓郵報2015年評選的“十大政界最有影響力億萬富翁”之一,他成為時任美國總統(tǒng)候選人特朗普2016年大選的主要資助者,當(dāng)然更重要的是,2013年他還主要資助成立了本次最大丑聞中的這家空殼公司——專門從事政治大數(shù)據(jù)分析的劍橋分析公司(Cambridge Analytica)。
轉(zhuǎn)折點:天才少年懷利和天才大叔班農(nóng)的見面
然而,事情的真正轉(zhuǎn)機,是在2013年計算機“天才少年”懷利(Christopher Wylie)與“天才大叔”、時任極右派媒體布賴特巴特新聞網(wǎng)(Breitbart News)執(zhí)行主席史蒂夫·班農(nóng)(Stephen Bannon)。
班農(nóng)1983年從哈佛商學(xué)院拿到MBA學(xué)位之后,從“窮二代”翻身成為高盛的投資銀行家,多年混跡投資銀行、電影和媒體界,與億萬富翁默瑟博士甚為熟稔。
2013年,23歲天才少年懷利和60歲的天才媒體大叔班農(nóng)的會面,成為特朗普扭轉(zhuǎn)美國大選走向的轉(zhuǎn)折點。
根據(jù)懷利后來的回憶,兩人的第一次見面充滿了戲劇性。
被稱為計算機“天才”的加拿大少年的懷利16歲輟學(xué),喜好政治,20歲進(jìn)入倫敦政治經(jīng)濟學(xué)院學(xué)習(xí)法律,2013年時值23歲的他正在攻讀流行預(yù)測博士學(xué)位。此前,劍橋大學(xué)心理測驗學(xué)中心兩位教授科辛斯基(Michal Kosinski)和史迪威爾(David Stillwel)在Facebook上開發(fā)多款應(yīng)用軟件預(yù)測網(wǎng)友性格特征和行為模式的研究,讓他眼界大開。
懷利關(guān)于如利用社交網(wǎng)絡(luò)的用戶數(shù)據(jù),建立起數(shù)據(jù)模型,給每一個用戶機器“畫像“”,瞄準(zhǔn)每一位用戶的“心魔”的“流行預(yù)測”算法,與班農(nóng)的想法不謀而合。兩人相見恨晚,大喜過望。
“特朗普看上去就像一雙UGG或者Crocs,你怎么才能讓人從感覺‘丑死了’,變成每個人都想穿它們,這就是他班農(nóng)在找的點。”懷利說。正好班農(nóng)也深信,政治只能算作文化的“下游”,“改變政治,先從改變文化開始,而文化流行趨勢就是一個重要載體。”
兩人一拍即合。班農(nóng)將懷利的計算機“流行預(yù)測”算法,推銷給了默瑟博士及其麗貝卡。當(dāng)即,慷慨解囊1300萬美元,在這一年(2013年)與英國數(shù)據(jù)分析公司SCL Elections聯(lián)合創(chuàng)辦了CA(劍橋數(shù)據(jù)公司)。
接下來的故事發(fā)展得格外順風(fēng)順?biāo)?/font>
一開始,川普金主、華爾街大佬默瑟博士創(chuàng)辦CA公司之后,曾派懷利與劍橋大學(xué)心理系著名教授辛斯基和史迪威爾的這一課題組聯(lián)系,試圖建立合作關(guān)系。該課題組在2007年以來發(fā)明了一整套針對facebook用戶信息抓取并進(jìn)行建模的技術(shù),但僅僅局限于學(xué)術(shù)研究領(lǐng)域。
因為涉及到數(shù)據(jù)倫理問題(用戶數(shù)據(jù)僅僅作為學(xué)術(shù)研究之用,而不能用于商業(yè)目的和政治選舉等其他用途),劍橋大學(xué)心理系的這一課題組負(fù)責(zé)人拒絕了懷利的要求。
關(guān)鍵時刻,一位來自劍橋大學(xué)心理學(xué)系的高級研究員科根(Aleksandr Kogan)主動站了出來。
高潮:神秘的科根博士是何方神圣?
得來全不費工夫。在劍橋大學(xué)心理學(xué)擔(dān)任高級研究員的科根博士還有一個秘密身份并不為人知。他同時也是俄國彼得堡大學(xué)副教授,并從俄國政府領(lǐng)取項目經(jīng)費,從事一項名為“社交網(wǎng)絡(luò)中的壓力與心理健康”的研究項目。CA公司后來基于用戶數(shù)據(jù)發(fā)明的美國大選“心理學(xué)建模”方法,正是此人在劍橋大學(xué)所參與的課題組所首創(chuàng)。
(科根博士,劍橋大學(xué)心理系高級研究員的身份背后,另一個身份是彼得堡大學(xué)副教授)
2014年6月4日,CA公司于科根博士注冊的一家名為全球科學(xué)研究(GSR)的公司達(dá)成合作,通過后者收集Facebook上的用戶數(shù)據(jù),了解用戶性格特征。
緊接著科根博士以學(xué)術(shù)研究的名義,與2015年推出基于可訪問Facebook的應(yīng)用程序“This Is Your Digital Life”,開始招募臉譜網(wǎng)上的年輕用戶,稱可以幫每一位感興趣的Facebook用戶免費提供你的個性預(yù)測,并且每名受訪者能得到2到5美元的報酬。
自愿參與測試的受訪者需要用自己的Facebook賬號登錄應(yīng)用,科根博士則可以通過隱藏這個小小APP里面的數(shù)據(jù)爬蟲技術(shù),計算機會遠(yuǎn)程自動收集到登錄者Facebook賬號上的 “城市”、“點贊”、“好友”等所有隱私資料和敏感的個人信息。
更恐怖的是,除了受訪者本人之外,這個迷你APP應(yīng)用還能收集受訪者每一位Facebook好友的所有數(shù)據(jù)資料。
據(jù)后來的統(tǒng)計,共有約32萬名美國選民參與此次測試,再加上被測試者每個人的Facebook好友,科根博士一下子收集到了超過5000萬Facebook用戶的數(shù)據(jù),并將5000萬份敏感的個人用戶資料悉數(shù)轉(zhuǎn)手賣給了第三方:劍橋分析公司(CA)和它的母公司SCL。
根據(jù)科根博士、懷利博士和默瑟博士的算法,研究人員將個性測試的結(jié)果與Facebook用戶的數(shù)據(jù)進(jìn)行匹配,先在推測用戶的心理模式基礎(chǔ)一,建立算法的初步數(shù)據(jù)模型。
接下來,研究人員可以將所有Facebook用戶的數(shù)據(jù)與選民記錄等資料進(jìn)行組合和匹配分析,再運用算法的數(shù)據(jù)模型,為每一位選民“畫像”,推算出每一位選民的上百個數(shù)據(jù)點:你的年齡、性別、工作、政治觀點、具有煽情點的興趣愛好,以及所謂的“心魔”(共鳴點)等等。
在掌握每一個選民的個人基礎(chǔ)信息后,CA公司再根據(jù)不同選民的特征,推送極具針對性、能準(zhǔn)確擊中用戶“心魔”(共鳴點)的政治廣告和各類消息。
根據(jù)衛(wèi)報的報道,科根博士竊取的這個擁有5000萬個Facebook用戶的數(shù)據(jù)庫中,包含了美國11個州的200萬個匹配文件,這些個人信息與選舉登記簿都充分匹配。而5000萬用戶的數(shù)據(jù),相當(dāng)于Facebook北美活躍用戶的1/3,其中1/4可能都是美國大選的選民。
謝幕:馬克· 扎克伯格和20億用戶,誰是沉默的羔羊?
故事至此,遠(yuǎn)未終結(jié)。
自從2018年3月16日英國《衛(wèi)報》、《紐約時報》、《觀察者報》等相繼追蹤報道Facebook泄露用戶敏感數(shù)據(jù)以來,包括馬克在內(nèi)的臉譜網(wǎng)高管一直保持高度緘默而備受批判,一周后,直到3月20日馬克才出面發(fā)聲,承認(rèn)“沒能保護(hù)好用戶數(shù)據(jù)”。
更嚴(yán)重的指責(zé)還在后面,根據(jù)馬克的坦白,早在2014年Facebook就發(fā)現(xiàn)了科根博士可疑的濫用數(shù)據(jù)行為,以及2015年從《衛(wèi)報》記者那里就獲知了科根博士倒賣數(shù)據(jù)的事實,但馬克本人和Facebook高層從未對用戶加以披露和說明。
根據(jù)英國數(shù)據(jù)保護(hù)法,CA公司和科根博士收集用戶信息的做法并未得到用戶許可,在未經(jīng)允許下將個人數(shù)據(jù)賣給第三方,更是屬于嚴(yán)重的違法行為。而科根此前被允許收集Facebook用戶信息,但聲稱僅僅限于學(xué)術(shù)研究目的之用。
更有意思的是,F(xiàn)acebook于2015年查封了科根的數(shù)據(jù)收集應(yīng)用權(quán)利,并要求科根和CA公司銷毀相關(guān)數(shù)據(jù)。懷利博士回憶說,所謂銷毀相關(guān)數(shù)據(jù),就是指只需在Facebook出具的證明文件上打個鉤,確認(rèn)自己銷毀了數(shù)據(jù),簽字后將文件寄回,就能證明數(shù)據(jù)已銷毀。
換言之,這5000萬Facebook用戶數(shù)據(jù)究竟有沒有被銷毀,依舊還是懸案。
Facebook大規(guī)模用戶數(shù)據(jù)嚴(yán)重泄露丑聞曝光后,其股價一路下跌,累計已跌近600億美元,其最新市值已經(jīng)被阿里巴巴超過(前者4920億美元,后者5100億美元)。
2018年將是馬克和Facebook的生死之年。
至于阿里巴巴,還是要提醒讀者一句。讀者諸君還記得2018年1月3日的支付寶用戶“年度個人賬單”曬單風(fēng)波嗎?一紙偷偷隱藏的協(xié)議要求每一個曬單用戶無償?shù)卦试S支付寶公司可以獲得你在支付寶上的所有信息,包括可以隨時隨地將這些用戶信息轉(zhuǎn)讓給第三者(支付寶的商業(yè)合作方)。
在律師岳屾山的友善提醒下,支付寶以稱呼自己“非常傻逼、愚蠢至極”的方式收回了這一做法。筆者想問的是,在商業(yè)巨頭、超級政府以及對倫理學(xué)不屑的那些頂尖AI科學(xué)家哪里,究竟誰才是真正的“非常傻逼、愚蠢至極”的對象呢?用戶?數(shù)據(jù)科學(xué)家?科技富豪?還是數(shù)字監(jiān)控惠及每一個網(wǎng)民的資深政客呢?