【中國時報/周韻采】
此次美國大選的開票過程對全世界猶如2008年那一場金融風暴,直到發生時,許多人還陷於驚訝中,無法置信。美國主流媒體與民調機構在世人面前展現了完美的集體誤差,就在選前一刻他們都還預測希拉蕊會當選。
川普與希拉蕊的第一場辯論時,我即利用社群大數據觀測美國大選。我發現兩人雖然在搖擺州的正向互動人數相差無幾,但川普支持者所製造的聲量(互動數)顯著超越希拉蕊,故我曾在同專欄裡說明這顯示川普的選民是較死忠,投票意願較高的一群人。在做選舉預測時,選民結構固然重要,但尚須估算各族群的投票意願及比例,才能精準推估選情。
從事後的出口民調顯示,希拉蕊著重的標靶選民:年輕人、女性及少數族群(拉丁裔)的投票率沒有預期的高,遠低於2012年投歐巴馬的比例。中老年白人占總人口的比例雖逐年下降,但因其投票率高,造成了希拉蕊在關鍵的搖擺州如密西根及威斯康辛州都僅以不到兩萬票差距落敗,進而失去大選。
民調不準的原因通常有三:一是樣本已偏離母體,隨著年輕人已不用市話,樣本的人口比例失真。但許多美國民調機構已將手機門號納入抽樣,同時年輕人傾向希拉蕊,故無法解釋為何民調皆偏向希拉蕊。其次,候選人得票差距在抽樣誤差範圍(±3.5%)內。的確,兩人在全國總投票數僅差0.2%,但在各州推估上則呈現2%到10%不等的誤差,其中以預測希拉蕊在威斯康辛州勝6%及密西根州勝3%為最。這表示民調在推估各州得票率上已出現系統性盲點。
第三、選民不願表態。我認為這可能才是造成此次民調失準的原因。原則上各家民調都會建構自己的模型推估不表態選民的意向,進而預測候選人的得票率。然而,主流媒體及民調機構在此次選舉中被川普陣營定義成建制派的幫兇,川普選民或許因此不信任民調,轉變成隱性選民,更不願意表態。這場選舉對民調界產生的震盪絕對不亞於政治版圖的重組,過去成熟且科學的推估方法面臨到政治劇變已全然不適用。過去70、80年來累積的專業,一剎那間化為烏有。民調界勢必進行方法論的改革,否則就會成為選舉史的一培黃土。
去年台灣總統大選時,我們也同樣以社群大數據預測選舉結果,證明了各候選人得票率的推估與實際結果差異不到2%。事後跟民調界的朋友比對數據,大家咸認這是未來選舉預測必走的方向。有志2018或2020大選的候選人和抬轎人注意了,歡迎來到新選舉預測時代,社群大數據等著你!(作者為元智大學資訊管理學系教授)
【2016/11/14】