2026 世界盃 48 隊誰能出線?
5 大統計模型 × 60 萬次蒙地卡羅模擬的奪冠機率全預測
史上第一屆 48 隊、12 組、104 場的世界盃在北美開踢。本文把 FIFA 官方積分、Elo 評分、Transfermarkt 全隊身價、歷屆世界盃戰績與近期大賽成績五種資料源,分別餵進五個獨立的統計模型,每個模型把賽事完整模擬 10 萬次,再以等權混合模型彙整。誰會從死亡之組爬出來?冠軍金盃最後落在誰手上?以下全部用經過驗證的數據說話。
混合模型奪冠機率:阿根廷、法國、西班牙三強鼎立
五個模型的每場比賽勝和負機率等權平均後再跑 10 萬次完整賽事,得到最終奪冠機率。衛冕軍阿根廷以 18.8% 居首,身價最高的法國 17.3% 緊咬,Elo 世界第一的西班牙 16.4% 第三,三強合計過半。橫條上的彩色圓點標出五個基礎模型各自的估計值,圓點散得越開,代表不同資料源對這支球隊的「分歧」越大。
五個模型看見五種世界盃
同一屆世界盃,不同資料源給出截然不同的劇本:Elo 模型獨愛西班牙(40.5%,Elo 2157 全場最高)、身價模型押注法國與英格蘭(合計 €28.4 億的兩套陣容)、歷史模型則把巴西與德國抬回王座(合計 9 座金盃的世界盃 DNA)。五個模型奪冠排名的 Spearman 等級相關最低只有 0.78,這種分歧正是採用混合模型的理由:沒有任何單一資料源壟斷真相。
為什麼用「等權混合」而不是挑一個最好的模型?
預測組合(forecast combination)文獻的經典結論是:多個合理模型的簡單平均,長期表現極難被任何單一模型穩定擊敗(Clemen, 1989)。五個模型的系統性偏差方向不同:Elo 高估近期連勝者、身價高估球星集中度、歷史高估傳統強權、FIFA 積分因計分規則天花板偏平。等權平均讓這些偏差互相抵銷,混合結果與五個外部專家模型的共識區間高度一致。
12 組出線機率:誰能活著走出小組賽
新制 48 隊分 12 組,每組前兩名直接晉級 32 強,12 個第三名中成績最好的 8 個也能晉級,整體出線率 66.7%,史上最寬鬆。但這也讓「第三名算盤」變成各隊的戰術現實。堆疊條由深至淺分別是小組頭名、第二名、以第三名晉級的機率,右側數字為總出線率。媒體共識的死亡之組是 I 組(法國、挪威、塞內加爾、伊拉克):三支 Elo 1850+ 的球隊擠在一起,挪威有 Haaland(身價 €2 億)卻只有 74% 出線率。
最可能的決賽劇本
10 萬次混合模型模擬中出現頻率最高的決賽組合。西班牙對阿根廷(7.0%)與法國對阿根廷(6.2%)是兩大主旋律:對戰樹上阿根廷(J 組)與西班牙(H 組)、法國(I 組)分屬不同半區,三強只有在 7 月 19 日 MetLife Stadium 的決賽才會相遇。注意機率分布的長尾:前 12 名組合合計也只佔約四成,六成的平行宇宙裡決賽是其他 1,100 多種組合,這就是單淘汰賽制的混沌本質。
親手擲骰子:互動蒙地卡羅模擬器
以下模擬器把與本文完全相同的混合模型引擎搬進你的瀏覽器:小組賽 72 場逐場抽比分、排積分淨勝球、挑 8 個最佳第三名、按 FIFA 官方對戰樹打完 31 場淘汰賽。你可以抽一個「平行宇宙」看單屆完整劇本,也可以連跑一萬次,親眼看著機率收斂到本文的預測值。
2026 世界盃模擬引擎
「抽一次平行宇宙」會完整跑完一屆世界盃並顯示每組戰績與淘汰賽歷程;「連跑 10,000 次」會即時統計奪冠次數,驗證蒙地卡羅收斂。
引擎與文中數據同源:混合模型機率 = 五模型等權平均;小組積分 → 淨勝球 → 進球 → 對戰結果排序;第三名籤位依 FIFA 公布之組別池回溯匹配。瀏覽器端使用非固定種子,每次結果都不同。
賽前的軍備競賽:歸化與改披戰袍的新援
本屆開賽前有一波明顯的「國籍轉換潮」,多名歐洲青訓出身的球員改披新戰袍。這些異動已經反映在 6 月 4 日的 Transfermarkt 名單身價裡,也就是說身價模型天然把「近期收編的球員戰力」計入評分。以下是經查證的代表案例:
方法論、假設與驗證:每個數字怎麼來的
一、資料與模型設定
所有輸入資料皆於 2026-06-11 開賽前採集並交叉驗證:12 組分組經 Wikipedia 與 NBC Sports 兩個獨立來源比對一致;淘汰賽對戰樹(含 8 個最佳第三名的籤位組別池)經 Wikipedia 與 ESPN 比對一致;FIFA 積分取自官方 6 月 11 日釋出的賽前最後一期;Elo 取自 eloratings.net 即時資料並與 Wikipedia 快照核對;身價取自 Transfermarkt 公布的 26 人正式名單總值(48 隊合計 €172.5 億)。
| 模型 | 戰力來源 | 映射方式 | 校準品質 |
|---|---|---|---|
| M1 Elo | eloratings.net(2026-06-11) | 直接使用,勝率 We = 1/(1+10^(−Δr/400)) | 原生尺度 |
| M2 FIFA 積分 | FIFA 官方排名(2026-06-11) | FIFA 公式除數 600,等價換算 rating = pts × 2/3 | 官方公式 |
| M3 身價 | Transfermarkt 26 人名單(2026-06-04) | OLS:Elo = a + b·ln(身價 €M) | R² = 0.667 |
| M4 歷史 × 近期 | 歷屆世界盃戰績 + 近期大賽 | S = 3×冠軍 + 2×決賽 + 1.5×四強 + 0.5×勝場 + 0.25×屆數 + 1.5×近期分,OLS:Elo = a + b·√S | R² = 0.525 |
| M5 Poisson | M1–M4 中心化平均的綜合戰力 | 雙 Poisson 比分模擬:總進球 2.65、μ = Δr/170 | 比分層級 |
| M6 混合 | M1–M5 | 每場比賽勝和負機率等權平均 | 組合預測 |
共同假設:地主優勢給美國、墨西哥、加拿大 +80 Elo 等價分(足球文獻的主場優勢約 100 分,三國非每場主場故取保守值,Goldman Sachs 與 Reade 的模型同樣內建地主修正);和局機率採 pD = 0.285·exp(−(Δr/700)²),等強度對戰和局率 28.5%,對應近三屆世界盃小組賽 24–31% 的實際區間;淘汰賽90 分鐘和局後以去和局相對勝率決定延長賽與 PK 結果;小組排名依積分、淨勝球、進球數、對戰結果、抽籤;第三名籤位依 FIFA 公布的各場組別池做回溯匹配(FIFA 實際使用 495 種預定義情境表,兩者等價)。
二、內部一致性與收斂檢查
每個模型 10 萬次模擬中,冠軍機率總和恆等於 100%、決賽席位恆等於 200%、32 強席位恆等於 3,200%,全部通過程式化檢查。蒙地卡羅標準誤在 p = 10% 時約 ±0.09 個百分點,意即文中所有機率的抽樣誤差小於 0.1 個百分點,遠小於模型間的系統性差異。文中互動模擬器即可親手驗證收斂:連跑一萬次的結果會落在本文數字 ±0.6 個百分點內。
三、外部驗證:博彩市場
博彩賠率是預測市場的「集體智慧基準」。把 BetMGM、DraftKings、FanDuel 三家 6 月 10–11 日的奪冠賠率轉成隱含機率、取平均並正規化抽水後,與混合模型比較:Spearman 等級相關 0.81、平均絕對誤差 2.2 個百分點。最大分歧在阿根廷(模型 18.8% vs 市場約 11%)與英格蘭(模型 8.6% vs 市場約 14%):市場給英格蘭的溢價與給衛冕軍的折價,正好對應 Goldman Sachs 報告中討論的「衛冕魔咒」與英格蘭歷年的「賠率人氣稅」,學術模型(Reade 給阿根廷 23%、KU Leuven 16.8%)反而與本文更接近。
四、外部驗證:五個公開專家模型
賽前共有五個可查證的公開模型發布了奪冠機率。本文混合模型與其中四個的 Spearman 等級相關都在 0.6–0.9:與 Reade 的 Poisson 回歸最接近(0.90)、與 KU Leuven 的 Elo 模型 0.80、與 Opta 超級電腦 0.76。Stern 模型僅公布前 4 名(n = 4 的等級相關統計上無意義,列出僅供參考)。五個外部模型的冠軍人選全部落在本文的前五名之內。
五、敏感度分析與限制
地主優勢是影響最大的假設參數。把 +80 改為 0 或 +160 重跑 5 萬次:墨西哥奪冠率在 0.5%、2.8%、9.8% 之間移動,美國在 0.3%、1.8%、7.0% 之間,但前三強(阿根廷、法國、西班牙)的排序在三種設定下都不變,奪冠率變動僅 1–3 個百分點。換言之,地主假設主導三支地主隊的數字,但不動搖整體結論。