文:皮爾森數據網路調查中心
民調的崩盤暴起暴落品質藏在細項樣本數裡,樣本數越少誤差越大。狂飆
本文非質疑民調準確性,善變而是媒調報導支的原聚焦在新聞標題與選材的討論,故不討論各家民調抽樣方法。體民理解民調報表、持度看待民調結果,因只樣本除了支持度的誤差數字外,還需了解樣本數以及抽樣誤差的崩盤暴起暴落意義。
本次選舉,狂飆賴清德、善變侯友宜、媒調報導支的原柯文哲三組候選人,體民在不同年齡層的持度選民支持度上各有優勢,使得年輕族群的因只樣本支持度成為各方關注焦點。新聞標題以「崩盤、慘跌、重挫、飆升」等字眼來形容年輕族群的支持度,屢見於本次大選中。
年輕族群民調支持度相關報導 | |
時間 | 標題 |
8月中 | 大選三腳督!柯文哲20至29歲年輕選票大跌7.7%快被賴清德超車 |
11月初 | 柯文哲剩18%!專家曝崩盤主因『年輕票丟了』 |
11月中 | 2024最新民調曝光!吳子嘉分析驚人1變化:他『2族群』票突然增加了 |
12月底 | 柯文哲年輕票重挫侯康配猛衝『藍白差距再擴大』 |
欲討論年輕族群族群支持度變化,不能忽視抽樣誤差。一般民調在成本效益的權衡下,至少都會做滿1068份樣本,在95%信心水準下,抽樣誤差約為正負3%內。然而,若要討論如20-29歲年輕族群等細項的支持度,隨著分配到各年齡層樣本數減少,抽樣誤差將增加超過正負3%。抽樣誤差的計算方式公式如下,以下提供20-29歲抽樣誤差試算。
- 假設單次民調樣本數為1068份,依20-29歲族群佔選舉人數比例,抽樣人數應為156人,按照上述公式就更不能忽視,在該份民意調查報表中,20-29歲族群抽樣誤差為7.8%、兩次支持度對比的最大抽樣誤差至少達11.1%。
若20-29歲抽樣人數不足,透過加權放大樣本數,實際誤差也將會隨著樣本膨脹而增高。
另,本次選舉有少數公開民調報表,以5歲為區間進行年齡變項合併。需留意當20-25歲樣本數少於100人,此時最大抽樣誤差至少達9.8%,同一位候選人20-25歲族群兩次支持度對比,最大抽樣誤差至少達13.9%。
綜上所述,無論是以性別、年齡或地區,討論候選人各族群的支持度,都需要注意樣本數分配過後,抽樣誤差增加的現象,避免淪為數字遊戲。關注年輕族群支持度時,更需注意年輕人口佔比少導致的樣本數少、抽樣誤差大,從統計上來看,候選人在年輕人支持度的波動,難以辨識究竟源自民意轉向,或只是抽樣誤差。
這次選舉,常有報導稱某族群支持度今天「崩盤」、明天「飆升」,民調風向看似每天都在變、民意如流水,也使得閱聽人對選情越來越疑惑。
案例一:美麗島追蹤民調(20-29歲)
柯文哲在年輕族群相對擁有較高的支持度,若針對這個族群的支持度寫新聞,背後隱藏著小樣本大誤差的問題,已如上述。本文就美麗島追蹤民調,持續公布之完整統計交叉分析報表,討論相關報導不合理之處。
12月底接近民調封關之際,各家媒體大量報導民調結果,並以表二中的標題,根據美麗島追蹤民調之結果,形容柯文哲20-29歲族群的支持度。本文表列美麗島追蹤民調,針對柯文哲20-29歲族群的支持度。
美麗島追蹤民調年輕族群支持度相關報導 | |
時間 | 標題 |
第96波 | 農地爭議重傷柯P?!美麗島最新民調年輕票出現驚人巨變 |
第98波 | 美麗島民調/年齡層支持度曝 「柯盈配」年輕票流失僅30-39歲微領先 |
第100波 | 凱旋苑PK賴皮寮!美麗島最新民調太震撼 「他」年輕票暴升近8% |
根據統計細看整體趨勢,20-29歲柯文哲支持度雖然有波動,但仍維持30%左右,並未有太大變化。根據本文前段試算結果,20-29歲支持度最大抽樣誤差11.1%,下表中柯文哲20-29歲支持度波動幾乎都在誤差範圍內(註:美麗島每波追蹤民調有約三分之二的樣本與前一波重複,誤差計算過於複雜,此處不另討論)。
將第86、89、92波調查,與第95、98、101波調查結果整合比較,顯示十二月上旬與下旬,柯文哲年輕族群的支持度其實相當穩定:
第86、89、92波(12/06-12/18):34.80%(樣本≈525)
第95、98、101波(12/19-12/29):32.35%(樣本≈572)
美麗島追蹤民調歷次柯文哲年輕族群支持度列表 | ||
調查期間 | 柯文哲 20-29歲支持度 | |
第94波 | 12/18-12/20 | 30.0% |
第95波 | 12/19-12/21 | 31.3% |
第96波 | 12/20-12/22 | 27.2% |
第97波 | 12/21、12/22、12/25 | 29.9% |
第98波 | 12/22、12/25、12/26 | 25.5% |
第99波 | 12/25-12/27 | 28.4% |
第100波 | 12/26-12/28 | 36.1% |
第101波 | 12/27-12/29 | 40.2% |
然而,有些報導並未提醒誤差值,也沒有耐心等待更多樣本累積,以「震撼、巨變、驚人」註解這些很可能只是誤差導致的數字波動。對不熟悉抽樣誤差的閱聽人而言,按照這種方式理解民調,難怪會出現「年輕人太善變」、「大起大落逾10%」等可能加劇社會對立歧見的論調。
數字是冷冰冰的,人卻是活生生的。表格上的數字,或許讓人抽離實際的生活情境。但所謂10%支持度的起落,推算到實際母群人口數,相當於全台灣實實在在的28萬名20-29歲年輕人。
難道在一、二週內,全國30萬年輕人突然放棄了柯文哲,不久又有15萬年輕人默默回頭支持柯文哲嗎。這顯然違反基本投票行為理論等常識。年輕人的政治傾向或許尚未定型,但在不負責任的民調解釋下,被詮釋成「亂竄」的選民,是相當不合理的。
案例二:美麗島追蹤民調(台北市)
柯文哲在台北市執政8年,柯文哲與黃珊珊,在2014、2018、2022年的得票率分別為57.16%、41.1%、25.14%。
值得注意的是,後兩次選舉,柯文哲與黃珊珊,都是在同時有國民黨與民進黨候選人的競爭下取得得票率,可說至少有兩成的台北市民,在同時有二黨候選人的情況下,仍較支持柯文哲。然而到了12月底,卻陸續有報導以「流失、墊底、支持度僅剩10%」等詞彙形容柯文哲的台北市支持度。
美麗島追蹤民調台北市族群支持度相關報導 | |
時間 | 標題 |
第97波 | 美麗島民調/總統本命區支持度曝光 柯文哲台北市慘墊底僅10% |
第98波 | 【美麗島總統民調】綠藍相差9% 柯盈配「主場」台北市僅11.7%支持度 |
雖然總統支持度與市長支持度未必一致,但在曾經執政8年的台北市僅剩10%支持度,這樣的解讀還是令人困惑。本文表列美麗島追蹤民調,針對柯文哲台北市族群的支持度如後。
美麗島追蹤民調歷次柯文哲台北市族群支持度列表 | ||
調查期間 | 柯文哲台北市支持度 | |
第94波 | 12/18-12/20 | 19.7% |
第95波 | 12/19-12/21 | 14.7% |
第96波 | 12/20-12/22 | 8.6% |
第97波 | 12/21、12/22、12/25 | 10.0% |
第98波 | 12/22、12/25、12/26 | 11.7% |
第99波 | 12/25-12/27 | 18.0% |
第100波 | 12/26-12/28 | 21.3% |
第101波 | 12/27-12/29 | 19.9% |
第94波與第101波的調查,僅相隔一週的時間,柯文哲在台北市的支持度維持在20%左右。然而在第95-98波的調查中,一旦加入12月21日或12月22日的樣本,柯文哲台北市支持度就瞬間「雪崩」到10%左右。然而相近時間的其他調查結果,只要不含這二天的樣本,支持度就飆升回到二成左右。
同一批民調,柯文哲總體支持度波動不到2.6%,小於誤差範圍。台北市卻出現短時間前後超過10%支持度的起落,推算到實際母群人口數,代表的是25萬台北市民,在短時間內轉離又再度轉向柯文哲。即便柯文哲在這段期間有農地爭議,但總體支持度波動小的情況下,柯文哲台北市支持度的波動原因,更可能屬於細項樣本太少導致的誤差。
本文根據美麗島追蹤民調結果,試分析柯文哲支持者中的二大族群,20-29歲年輕族群、台北市族群。若是忽視樣本數與誤差等資訊,過度解讀細項數字,將對民調結果造成相當程度的誤解。若各選舉團隊也如此理解選情,將會多少造成錯誤決策。