Kalshi 首份研究報告:當預測 CPI 時,群體智慧擊敗華爾街智囊團

By: blockbeats|2025/12/24 08:00:07
分享
copy
原文标题:超越共识:预测市场与通货膨胀冲击预测
原文来源:Kalshi 研究
原文编译:Azuma,Odaily 星球日报

编者按:头部预测市场平台 Kalshi 昨日宣布推出一款全新的研究报告栏目 Kalshi 研究,旨在向那些对预测市场相关主题感兴趣的学者和研究人员提供 Kalshi 的内部数据。该栏目的首篇研究报告现已发布,以下为该报告原文内容,由 Odaily 星球日报编译:

Kalshi 首份研究報告:當預測 CPI 時,群體智慧擊敗華爾街智囊團

概览

一般在重要经济统计数据发布的前一周,大型金融机构的分析师和高级经济学家都会给出对预期数值的预估。这些预测汇总在一起后会被称为「共识预期」,已被广泛视为洞察市场变化与调整仓位布局的重要参考。

在本研究报告中,我们比较了共识预期与 Kalshi 预测市场的隐含定价(下文有时会简称为「市场预测」)在预测同一个核心宏观经济信号——同比整体通货膨胀率(YOY CPI)——真实数值方面的表现。

关键亮点

· 整体准确性占优:在所有市场环境下(包括正常环境和冲击环境),Kalshi 预测的平均绝对误差(MAE)比共识预期低 40.1%

·「冲击 Alpha」(Shock Alpha):在出现重大冲击时(大于 0.2 个百分点),在提前一周的预测窗口内,Kalshi 的预测比共识预期的 MAE 低 50%,若在数据公布前一天,MAE 会进一步扩大至 60%;在出现中等冲击时(0.1 - 0.2 个百分点之间),在提前一周的预测窗口内,Kalshi 的预测比「共识预期」的 MAE 同样低 50%,在数据公布前一天则会扩大至 56.2%。

· 预测信号(Predictive Signal):当市场预测与共识预期的偏差超过 0.1 个百分点时,预测发生冲击的概率约为 81.2%,在数据公布前一天则会升至约 82.4%。在市场预测与共识预期不一致的情况下,市场预测在 75% 的案例中更为准确。

背景

宏觀經濟預測者面臨一個內在挑戰:預測最為重要的時刻——即市場失序、政策轉向以及結構性斷裂之時——恰恰也是歷史模型最容易失效的階段。金融市場參與者通常會在關鍵經濟數據公布前數日發布共識預測,將專家意見匯總為市場的預期。然而,這些共識觀點儘管具有價值,卻往往共享著相似的方法論路徑和信息來源。

對於機構投資者、風險管理者和政策制定者而言,預測準確性的利害關係是不對稱的。在無爭議時期,稍好一點的預測只能提供有限的價值;但在市場混亂時期——當波動率飆升、相關性瓦解或歷史關係失效時——更優的準確性則可以帶來顯著的 Alpha 收益並限制回撤。

因此,理解參數在市場波動時期的行為特徵至關重要。我們將聚焦於一項關鍵宏觀經濟指標——同比整體通膨率(YOY CPI)——這是未來利率決策的核心參考指標,也是衡量經濟健康狀況的重要信號。

我們比較和評估了在官方數據公布前多個時間窗口內的預測準確性。我們的核心發現是,所謂的「衝擊 Alpha」確實存在——即在尾部事件中,基於市場的預測相較於共識基準可實現額外的預測精度。這種超額表現並不僅僅意味著純粹的學術意義,而是在預測誤差具有最高經濟成本的關鍵時刻,可顯著提升信號質量。在這一背景下,真正重要的問題並非預測市場是否「總是正確」,而是它們是否提供了一種值得被納入傳統決策框架的、具有差異化價值的信號。

方法論

數據

我們分析了預測市場交易者在 Kalshi 平台上的每日隱含預測值,涵蓋三個時間節點:數據公布前一周(與共識預期發布時間匹配)、公布前一天、公布當日上午。所使用的每一個市場均為(或曾為)真實可交易的在運行市場,反映了在不同流動性水平下的真實資金頭寸。對於共識預期,我們收集了機構層面的 YoY CPI 共識預測,這些預測通常在美國勞工統計局官方數據公布前約一周公布。

樣本區間取自 2023 年 2 月至 2025 年中期,涵蓋了超過 25 個月度 CPI 發布周期,橫跨多種不同的宏觀經濟環境。

衝擊分類

我們根據相對於歷史水平的「意外幅度」將事件分成了三類。「衝擊」被定義為共識預期與實際公布數據之間的絕對差值:

· 正常事件:YOY CPI 的預測誤差低於 0.1 個百分點;

· 中等衝擊:YOY CPI 的預測誤差介於 0.1 至 0.2 個百分點之間;

· 重大衝擊:YOY CPI 的預測誤差超過 0.2 個百分點。

該分類方法使我們能夠檢驗:預測優勢是否會隨著預測難度的變化而呈現出系統性的差異。

績效指標

為了評估預測表現,我們採用以下指標:

· 平均絕對誤差(MAE):主要的準確性指標,計算方式為預測值與實際值之間絕對差的平均值。

· 勝率:當共識預期與市場預測之間的差異達到或超過 0.1 個百分點(四捨五入至一位小數)時,我們會記錄哪一個預測更接近最終實際結果。

· 預測時間跨度分析:我們追蹤市場估值的準確性如何從發布前一周到發布日逐步演變,以揭示持續納入信息所帶來的價值。

結果:CPI 預測表現

整體準確性更占優

在所有市場環境下,基於市場的 CPI 預測相較於共識預測,平均絕對誤差(MAE)要低 40.1%。在所有時間跨度上,基於市場的 CPI 預測 MAE 比共識預期要低 40.1%(提前一周)至 42.3%(提前一天)。

此外,在共識預期與市場隱含值存在分歧的情況下,Kalshi 基於市場的預測展現出具有統計顯著性的勝率,範圍從提前一周的 75.0% 到發布當天的 81.2%。若將與共識預期打平的情況(精確到一位小數)一併計入,基於市場的預測在提前一周時約有 85% 的情況下與共識持平或表現更優。

如此高的方向性準確率表明:當市場預測與共識預期出現分歧時,這種分歧本身對「是否可能發生衝擊事件」具有顯著的信息價值。

「衝擊 Alpha」確實存在

準確性的差異在衝擊事件期間表現得尤為明顯。在中等衝擊事件中,當發布時間一致時市場預測的 MAE 要與共識預期低 50%,在數據公布前一天這一優勢則會擴大至 56.2% 乃至更多;在重大衝擊事件中,當發布時間一致時市場預測的 MAE 同樣要與共識預期低 50%,在數據公布前一天則可達到 60% 乃至更多;而在未發生衝擊的正常環境中,市場預測與共識預期的表現大致相當。

儘管衝擊事件的樣本數量較小(這在一個「衝擊本就高度不可預測」的世界中是合理的),但整體模式卻非常清晰:當預測環境最為艱難之時,市場的信息聚合優勢反而最具價值

然而,更重要的不僅僅是 Kalshi 的預測在衝擊時期的表現更優,還在於市場預測與共識預期之間的分歧本身可能就是衝擊即將發生的信號。在存在分歧的情況下,市場預測相對於共識預期的勝率達到 75%(在可比時間窗口內)。此外閾值分析進一步表明:當市場與共識的偏差超過 0.1 個百分比時,預測發生衝擊的概率約為 81.2%,而在數據公布前一天,這一概率進一步上升至約 84.2%。

這一在實踐層面具有顯著意義的差異表明:預測市場不僅可以作為與共識預期並列的競爭性預測工具,還可以作為一種關於預測不確定性的「元信號」,將市場與共識的分歧轉化為一種可量化的、用於預警潛在意外結果的早期指標。

衍生討論

一個顯而易見的問題隨之而來:為什麼在衝擊期間,市場預測會優於共識預測?我們提出了三種相互補充的機制來解釋這一現象。

市場參與者異質性與「群體智慧」

傳統的共識預期雖然整合了多家機構的觀點,但往往共享相似的方法論假設和信息來源。計量經濟模型、華爾街研究報告以及政府數據發布構成了一個高度重疊的共同知識基礎。

相比之下,預測市場匯聚了具有不同信息基礎的參與者所持有的頭寸:包括專有模型、行業層面的洞察、替代數據來源以及基於經驗的直覺判斷。這種參與者多樣性在「群體智慧」(wisdom of crowds)理論中具有堅實的理論基礎。該理論表明,當參與者掌握相關信息且其預測誤差並非完全相關時,將來自多樣化來源的獨立預測進行聚合,往往能夠產生更優的估計結果。

而在宏觀環境發生「狀態切換」之時,這種資訊多樣性的價值尤為突出——擁有零散、局部資訊的個體在市場中進行交互,其資訊碎片得以組合,從而形成一個集體信號。

參與者激勵結構的差異

機構層面的共識預測者往往處於複雜的組織與聲譽體系之中,這種體系會系統性地偏離「純粹追求預測準確性」的目標。職業預測者所面臨的職業風險,形成了一種非對稱的收益結構——較大的預測失誤會造成顯著的聲譽成本,而即便預測極其準確,尤其是通過大幅偏離同行共識而實現的準確性,也未必能獲得成比例的職業回報。

這種非對稱性誘發了「從眾行為」(herding),即預測者傾向於將自己的預測聚攏在共識值附近,即便其私人資訊或模型輸出暗示了不同的結果。原因在於,在職業體系中,「孤立地犯錯」的成本往往高於「孤立地正確」的收益。

與此形成鮮明對比的是,預測市場參與者所面臨的激勵機制實現了預測準確性與經濟結果之間的直接對齊——預測準確意味著盈利,預測錯誤意味著虧損。在這一體系中,聲譽因素幾乎不存在,偏離市場共識的唯一代價是經濟上的損失,且完全取決於預測是否正確。這種結構對預測準確性施加了更強的選擇壓力——能夠系統性識別共識預測錯誤的參與者會不斷積累資本,並通過更大的倉位規模增強其在市場中的影響力;而那些機械性跟隨共識的參與者,則會在共識被證明錯誤時持續遭受損失。

在不確定性顯著上升的時期,當機構預測者偏離專家共識的職業成本達到最高點時,這種激勵結構的分化往往最為明顯,且在經濟意義上最為重要。

資訊聚合效率

一個值得注意的經驗事實是:即便在數據公佈前一周——這一時間點與共識預期發布的典型時間窗口一致——市場預測仍然表現出顯著的準確性優勢。這表明,市場優勢並非僅僅源自預測市場參與者通常被提及的「資訊獲取速度優勢」。

相反,市場預測可能更高效地聚合了那些過於分散、過於行業化或過於模糊,以至於難以被正式納入傳統計量經濟預測框架的信息碎片。預測市場的相對優勢,可能並不在於更早接觸到公共信息,而在於其能夠在相同時間尺度內,更有效地綜合異質信息——而基於問卷調查的共識機制,即便擁有同樣的時間窗口,也往往難以高效處理這些信息。

局限性與注意事項

我們的研究結果需要做出一項重要限定。由於整體樣本僅覆蓋約 30 個月,重大衝擊事件在定義上本就十分罕見,這意味著對於較大的尾部事件,統計效力仍然有限。更長的時間序列將增強未來的推斷能力,儘管當前的結果已強烈暗示了市場預測的優越性與信號的差異性。

結論

我們記錄了預測市場相對於專家共識預期在系統性和經濟意義上的顯著尤其表現,尤其是在預測準確性最為關鍵的衝擊事件期間。基於市場的 CPI 預測在整體上的誤差要低約 40%,而在重大結構性變化時期,其誤差降低幅度可達約 60%。

基於這些發現,未來的幾項研究方向變得尤為重要:一是通過更大樣本規模、跨多種宏觀經濟指標,研究「衝擊 Alpha」事件本身是否可以通過波動性和預測分歧指標進行預測;二是預測市場在何種流動性門檻之上,能夠穩定地超越傳統預測方法;三是預測市場的預測值與由高頻交易金融工具隱含出的預測值之間的關係。

在共識預測高度依賴相關性較強的模型假設與共享信息集的環境中,預測市場提供了一種替代性的信息聚合機制,能夠更早地捕捉到狀態切換,並更高效地處理異質信息。對於那些需要在結構性不確定性和尾部事件頻率不斷上升的經濟環境中做出決策的主體而言,「衝擊 Alpha」或許不僅僅代表著預測能力的漸進式改進,更應成為其穩健風險管理基礎設施的一個基本組成部分。

原文鏈接

猜你喜歡

收費昂貴數十倍卻無法贏過市場表現,頂級避險基金究竟在賣什麼?

對沖基金賣的不是跑贏大盤,而是因子中性和高夏普比率這種無法複製、能顯著提升組合效率的稀缺收益。

2天20倍,久違金狗Snowball的「自動做市」雪球能滾到多大?

Snowball 透過 pump.fun 採用「100% 作者費用自動回購 + 流動性注入 + 銷毀」機制,試圖解決模因幣最典型的跑路問題。

2天20倍,速览新金狗 Snowball 的自动做市机制

Key Takeaways Snowball 是一個新穎的 Meme 幣,主要對象是將創作者費用自動轉化為買盤,從而提升幣價。 項目發射後僅四天,市值已突破1000萬美元,交易橫跨7270多個地址。 此機制在於防止開發者挪用資金,提高市場透明度,吸引流動性。 正如過往的 OlympusDAO 和 Safemoon,這類機制能在短期內引發大量注意,但長期成效視市場動態而定。 WEEX Crypto News, 2025-12-22 16:02:39 緣起及背景…

12月22日 關鍵市場信息差,一定要看!|Alpha 早報

1.頭條新聞:LIGHT 閃崩,近4小時合約爆倉金額全網第一 2.代幣解鎖:$MBG

呼籲加入人工智慧戰爭: WEEX Alpha 醒來 — 全球人工智慧交易競賽,獎金池達 $880,000

現在,我們呼籲全世界的人工智能交易者加入人工智能戰爭: WEEX Alpha Awakens,全球人工智能交易賽,獎池88萬美元。

WEEX AI Trading黑客松:參與者指南

在這場終極對決中,全球頂尖開發者、量化分析師與交易者將齊聚真實市場,展開算法巔峰較量,爭奪AI加密貨幣交易史上最豐厚的獎池——88萬美元,冠軍更可斬獲賓利添越S一輛。本指南將全程指引您完成從報名到賽事啟動的每一個關鍵步驟。

熱門幣種

最新加密貨幣要聞

閱讀更多