選舉大數據不似預期?
即使有白宮群英出謀獻策、荷里活巨星在社交網絡吶喊助威、各大主流傳媒亦近乎義無反悔地一片唱好,希拉莉最終仍黯然落敗,特朗普成為美國第45任總統,於是有人不禁問:「如果大數據可預測未來,為何今回美國大選的結果,不單止不似預期,而且還要相差得那麼遠?」 坊間有不少人歸咎大數據出錯,但其實這是大錯特錯,首先,大部份人著眼中的民調,只不過是抽樣調查的「小數據」,所謂的大數據分析,除了數字樣本要有一定數量和代表性,同時,還要有多個數據源作數據模型分析比較,歷史數據及即時數據變動,兩者同樣重要。主流傳媒或者是希拉莉團隊的大數據分析、數據模型未必有錯,問題可能出於,數字樣本的全面性、可靠性,以及該團隊如何演繹大數據。 現在才說當然有點事後孔明,但正所謂勝者為皇,根據Cambridge Analytica這家特朗普背後的數據軍師的說法,主流民調以外,他們更集中注意力在主要支持者及捐款人的數據分析,從而推論出其他的潛在支持者所在之處,當中的投票人口,又會否在投票日出來投票,繼而在Facebook打針對性的廣告,外間以為特朗普陣營在Facebook不及對手活躍,其實不然。 然後又有人問:「為什麼我在Facebook上看到的,都是一面倒希拉莉氣勢如虹的消息?」這是今屆美國大選的另一個有趣現象,同時亦反映了目前Facebook的一大缺點。首先,由於被民調唱好希拉莉,不少傳媒也隨著不少人的主觀願望,繼續順水推舟,發表更多相關的正面消息。同時間,Facebook背後的運算機制,亦只會把與你有共同興趣,或者是相近取向的朋友的內容推送給你,不自不覺地,你自己變成了一個偏食兒童,你還是懵然不知。 最後,網絡假新聞和社交網絡造謠,同樣是今屆美國大選值得注意的現象,選舉過後,Facebook和Google都分別發表相應的對策,譬如禁止這類不良內容打廣告,雖然,此舉說易行難矣。