Amazon Web Services 再度發生重大故障,造成加密產業重要基礎設施大規模受損。自英國時間今日上午 8:00 起,美國東部 1 區(北維吉尼亞資料中心)出現 AWS 異常,Coinbase、Robinhood、Infura、Base、Solana 等數十家主流加密平台皆受影響,服務全面中斷。
AWS 已證實旗下核心資料庫 DynamoDB 及運算服務 EC2 出現「錯誤率升高」,這兩大基礎服務牽動數千家企業。本次即時當機,明確驗證本文核心主張:加密基礎設施高度依賴中心化雲端服務供應商,產生系統性風險,於極端壓力下屢屢暴露。
時機極為敏感。距離 193 億美元清算連鎖導致交易所基礎設施缺陷曝光僅十天,今日 AWS 當機再度證實問題已超越單一平台,蔓延至底層雲端基礎設施。AWS 故障時,影響將連鎖波及中心化交易所、倚賴中心化服務的「去中心化」平台,以及眾多加密服務。
此類事件並非偶發,而是反覆出現的系統性問題。下文將回顧 2025 年 4 月、2021 年 12 月及 2017 年 3 月的 AWS 類似故障,每次均導致主流加密服務大規模中斷。問題並非「是否再次發生」,而在於「何時爆發、由何引起」。
2025 年 10 月 10-11 日清算連鎖事件成為基礎設施故障的極具代表性案例。UTC 時間 20:00,重大地緣政治消息引發市場全面拋售,1 小時內清算金額高達 60 億美元。亞洲市場開盤時,193 億美元槓桿部位於 160 萬交易者帳戶全數蒸發。

圖 1:2025 年 10 月清算連鎖時間軸
互動式時間軸清楚展現清算事件逐時演變。首小時即清算 60 億美元,次小時災情擴大,連鎖加速放大。可視化顯示:
本事件規模遠超歷史任何加密市場紀錄。歷史對比突顯其階躍式轉變:

圖 2:歷史清算事件比較
柱狀圖直觀顯示 2025 年 10 月事件的特殊性:
清算數據僅是表象,更值得關注的是機制:外部市場事件何以觸發如此規模連鎖故障?答案揭示中心化交易所基礎架構與區塊鏈協議設計的系統性弱點。
交易所 API 設有限流機制,旨在防止濫用與控制伺服器負荷。正常情況下,這些機制保障交易順利並阻斷惡意攻擊。但在極端行情時,數千用戶同時調整倉位,限流機制卻成為嚴重瓶頸。
CEX 清算通知限流至每秒一單,即使實際需處理數千單。清算連鎖期間,資訊透明度進一步惡化。用戶無法即時掌握連鎖規模,第三方監控顯示每分鐘數百件清算,官方數據卻遠低於事實。
API 限流導致交易者於最關鍵首小時無法調整倉位。連線逾時、訂單提交失敗、停損單未成交、倉位查詢回傳過期資料。基礎設施瓶頸令市場事件升級為運維危機。
傳統交易所僅依日常負載與安全裕度配置基礎設施,但常規與壓力負載差距巨大。平均日成交量難以預測極端壓力需求。清算連鎖期間,成交量可暴增百倍,倉位查詢激增千倍,因所有用戶同時存取帳戶。

圖 4.5:AWS 故障對加密服務影響分析
自動擴容雖有助,但無法即時反應。新增資料庫唯讀副本需數分鐘,API 閘道實例亦需時間。期間,保證金系統仍依污染訂單簿價格標記倉位。
10 月清算連鎖期間,保證金系統設計暴露關鍵問題:部分交易所依據內部現貨價而非外部預言機進行抵押品估值。正常市況下,套利者能維持價格一致;但基礎設施壓力下,聯動效應失靈。

圖 3:預言機操控流程圖
互動流程圖將攻擊路徑分為五步:
攻擊者利用 Binance 以現貨價標記合成抵押品。當攻擊者於流動性薄弱訂單簿拋售 6000 萬美元 USDe,現貨價由 $1 急跌至 $0.65。保證金系統據此重估所有 USDe 抵押倉位,下調 35%,引發大規模強制清算。
強平進一步加劇拋壓,價格持續下跌。保證金系統再度下調更多倉位,回饋循環將 6000 萬美元賣壓放大為 193 億美元強制清算。

圖 4:清算連鎖回饋循環圖
循環回饋機制如下:
價格下跌 → 觸發清算 → 強制拋售 → 再度下跌 → [循環反覆]
若採完善預言機系統,此機制難以成立。Binance 若採多交易所 TWAP,瞬時操控不影響抵押品估值;如用 Chainlink 等多源預言機聚合,攻擊亦難奏效。
四天前 wBETH 事件同樣暴露類似風險。Wrapped Binance ETH(wBETH)應與 ETH 保持 1:1 兌換。清算連鎖期間,流動性枯竭,wBETH/ETH 現貨價出現 20% 折價,保證金系統隨之下調 wBETH 抵押品,實際由 ETH 完全抵押的倉位仍遭強平。
當清算無法依市價成交時,交易所採用自動減倉(ADL),將虧損分攤至獲利帳戶。ADL 依現價強制平掉獲利倉位,以彌補被清算帳戶的虧損。
10 月清算連鎖期間,Binance 在多個交易對執行 ADL。獲利多頭交易者被強制平倉,非因自身風險管理失誤,而是他人倉位破產所致。
ADL 反映中心化衍生品交易的基本架構選擇。交易所自保不虧損,意即虧損勢必由:
保險基金規模與未平倉部位比例決定 ADL 觸發頻率。2025 年 10 月 Binance 保險基金約 20 億美元,BTC、ETH、BNB 永續合約未平倉部位達 40 億美元,覆蓋率 50%。但清算連鎖期間,全市場未平倉部位破 200 億美元,保險基金難以承擔虧損。
事件後,Binance 宣布:BTC、ETH、BNB USDⓈ-M 合約總未平倉低於 40 億美元時,保證不發生 ADL。此激勵機制意味交易所能藉擴大保險基金避免 ADL,但將佔用可獲利資金。
柱狀圖比較各大故障事件停機時長:

圖 5:主流網路故障時長分析
Solana 於 2024-2025 年間多次當機。2024 年 2 月故障歷時約 5 小時,9 月故障長達 4-5 小時,根本原因皆在網路於垃圾攻擊或極端高流量下無法處理大量交易。
圖 5 細節:Solana 故障(2 月 5 小時,9 月 4.5 小時)反覆揭露網路於極端壓力下的韌性短板。
Solana 架構強調高吞吐,理論上每秒可處理 3000-5000 筆交易,秒級確認,效能遠勝 Ethereum。但壓力事件下,最佳化設計反成脆弱環節。
2024 年 9 月故障源於垃圾交易氾濫,驗證者投票機制徹底崩潰。Solana 驗證者需對區塊投票以達成共識。正常情境下,驗證者優先處理投票交易。但協議過往將投票交易與一般交易一視同仁,納入費用市場。
當記憶體池遭數百萬垃圾交易塞滿,驗證者難以傳播投票交易。投票不足,區塊無法最終確認,鏈條停滯。用戶待處理交易卡在記憶體池,新交易提交失敗。
StatusGator 記錄 2024-2025 年間 Solana 多次服務中斷,官方未公開披露,資訊不對稱。用戶難判斷是本地連線問題還是網路故障,第三方監控雖為補充,但平台應設透明狀態頁。
Ethereum 於 2021 年 DeFi 熱潮期間,Gas 費用暴增。簡易轉帳手續費逾 $100,複雜合約互動甚至高達 $500-1000。高昂費用使小額交易無法進行,並帶來新型攻擊向量:MEV 提取。

圖 7:網路壓力下交易成本變化
折線圖顯示各網路在壓力事件下 Gas 費用暴增:
圖表顯示,即使 Layer 2 方案也會大幅漲價,雖起點較低。
最大可提取價值(MEV)指驗證者透過重排、選擇或拒絕交易獲利。高 Gas 環境下,MEV 利潤非常可觀。套利者搶先 DEX 大額交易,清算機器人搶先清算抵押不足倉位,競價激烈。
用戶為確保交易被打包,需高於 MEV 機器人出價,有時手續費甚至高於交易本身。領取 $100 空投,需付 $150 Gas;補倉避免清算,得與機器人搶 $500 優先權。
Ethereum 的 Gas 上限限制區塊總運算量,壅塞時用戶競價稀缺區塊空間。費用市場機制如設計般運作:高價者優先,但高需求時網路成本暴增,正逢用戶最需操作時。
Layer 2 透過鏈下運算並繼承 Ethereum 安全性以改善。Optimism、Arbitrum 等 Rollup 離線處理數千筆交易,定期提交壓縮證明至 Ethereum。此架構正常情境下能明顯降低單筆費用。
Layer 2 同時帶來新瓶頸。2024 年 6 月,Optimism 空投時 25 萬地址同時申領,排序器(負責交易排序並提交至 Ethereum)完全癱瘓,用戶數小時無法提交交易。
本次故障突顯鏈下運算並不代表無需基礎設施擴容。排序器須處理、排序、執行交易並產生欺詐或 ZK 證明提交至 Ethereum。極端流量下,排序器面臨與獨立公鏈相同擴容難題。
多 RPC 服務商必須維持可用,主服務商故障時用戶應能自動切換。Optimism 故障期間,部分 RPC 正常,部分失效。錢包預設失效服務商的用戶無法與鏈互動,雖鏈本身未停。
AWS 故障屢次揭示加密產業基礎設施集中化風險:
模式明確:這些交易所關鍵元件皆託管於 AWS。一旦 AWS 區域故障,多家主流交易所與服務同時停擺。用戶於故障期間無法提領、交易或調整倉位,往往正值市場波動最需即時操作時刻。
Polygon(原名 Matic)於 2024 年 3 月經歷 11 小時停擺,根本原因為驗證者軟體版本不一致。部分節點使用舊版,部分升級新版,雙方對狀態轉換邏輯歧異。
圖 5 細節:Polygon 故障(11 小時)為分析樣本中最長,突顯共識故障嚴重性。
驗證者對系統狀態結論分歧,共識機制失效,無法產生新區塊。舊版驗證者拒絕新版區塊,新版拒絕舊版區塊,系統陷入死鎖。
恢復需協調所有驗證者升級,停擺期間協調極度困難,每節點須聯繫、重部署正確版本並重啟。在數百獨立驗證者的去中心化網路中,流程耗時漫長。
硬分叉通常以區塊高度觸發,確保所有節點同步升級,但須事前集中協調。漸進升級易導致版本不相容,正是 Polygon 故障根本原因。

圖 6:區塊鏈三難困境——去中心化與效能權衡
散點圖將各系統定位於兩大維度:
核心結論:沒有系統能兼具最大去中心化與最大效能,設計需針對場景權衡取捨。
中心化交易所以簡潔架構實現極低延遲。撮合引擎微秒級處理訂單,狀態集中儲存,毋須共識協議消耗效能。但同時存在單點故障,壓力下故障易於緊密耦合系統間連鎖擴散。
去中心化協議分散式儲存狀態,消弭單點風險。高吞吐鏈即使宕機,資金安全仍有保障,僅活性暫時中斷。但分散式共識需付出龐大運算與通訊成本。驗證者須達成一致才能最終更新狀態。若節點版本不相容或流量超載,共識機制可能暫時停滯。
增加副本提升容錯性,但加重協調負擔。每增一節點,拜占庭容錯系統需更多訊息交換。高吞吐架構藉最佳化驗證者通訊提升效能,但易受特定攻擊影響。安全型架構優先多樣化及共識穩健性,基礎層吞吐受限但韌性最強。
Layer 2 以分層設計兼顧兩者。繼承 Ethereum 安全性(L1 結算),鏈下運算高吞吐,但排序器與 RPC 層產生新瓶頸,架構複雜性雖解決部分問題,卻也帶來新故障模式。
上述事件反覆證明:系統僅依日常負載配置,一旦壓力爆發即災難性失效。Solana 能穩定承受日常流量,但交易量暴增百倍即崩潰。Ethereum Gas 費平時合理,DeFi 應用推升壅塞激增。Optimism 正常運作,直到 25 萬地址同時空投。Binance API 日常穩定,清算連鎖時限流反成瓶頸。
2025 年 10 月事件於交易所層面充分證明此動態。平時 Binance API 速率與資料庫連線充足,但清算連鎖時,所有交易者同時調整倉位,限流機制成致命瓶頸。為保護交易所而設計的保證金系統,反於危機時刻製造大規模被動賣壓。
自動擴容無法即時因應階躍式負載暴增。增設伺服器需數分鐘,而保證金系統早已依污染訂單簿資料錯誤標記。待新容量上線,連鎖危機已全面擴散。
為罕見壓力事件超配資源,平時成本極高,交易所經營者多依典型負載最佳化,偶發故障被視為經濟合理。停擺成本由用戶承擔,包括被強制平倉、交易卡死或關鍵時刻無法存取資金。

圖 8:2024-2025 年基礎設施故障根本原因分布
圓餅圖揭示主要根本原因:
多種架構調整可降低故障頻率及影響,但皆有權衡:
10 月事故部分肇因於保證金計算與現貨價高度耦合。包裝資產採用兌換比例而非現貨價,可杜絕 wBETH 錯價。更廣泛而言,關鍵風險管理系統不應依賴易被操控的市場資料。獨立預言機、多源聚合與 TWAP 機制能提供更穩健價格。
2025 年 4 月 AWS 故障影響 Binance、KuCoin、MEXC,凸顯基礎設施集中依賴風險。將核心元件部署於多家雲端服務商,雖提升運維與成本,卻能消除相關性故障。Layer 2 網路可設多 RPC 服務商並自動切換。平時看似浪費,高峰期卻能避免長時間停擺。
系統「正常運作直到崩潰」反映壓力測試不足。應標準化模擬百倍常規負載,開發期發現瓶頸遠勝於實際停擺時才發現。真實流量模式難以完全測試覆蓋,用戶事故時行為與測試中大不相同。
超配資源最可靠,卻與經濟誘因衝突。為罕見事件維持十倍冗餘,每日均需負擔高昂成本,只為一年一次故障買保險。唯有災難造成巨大損失,超配才有經濟合理性,系統方能於壓力下不再失效。
監管壓力或促成變革。若規定 99.9% 在線率或限制停擺時長,交易所勢必超配。但監管多半事後追溯非預防。Mt. Gox 2014 崩盤促使日本立法加密交易所監管,2025 年 10 月清算連鎖或引發類似政策。監管究竟規範結果(最大停擺時長、清算滑點上限)或具體措施(指定預言機、斷路器門檻),目前尚未明朗。
核心挑戰在於加密系統全球不間斷運作,但基礎設施仍依傳統營業時間設計。凌晨兩點故障時,團隊急修,用戶蒙受巨大損失。傳統市場壓力時可暫停交易,加密市場則直接「崩潰」,究竟是優勢還是缺陷,見仁見智。
區塊鏈系統在短時間內完成技術躍進,分散式共識屬工程壯舉。但若要於壓力下穩定運行,必須從原型升級至生產級基礎設施,投入資金,優先穩健性而非功能擴充。
難題在於牛市高成長期,穩健性易遭忽略。人人獲利時,停擺彷彿只是他人問題。下一輪週期壓力再現,必定暴露新漏洞。產業能否吸取 2025 年 10 月教訓,或重蹈舊路?歷史已顯示,下個數十億美元級壓力故障必將揭露新的關鍵弱點。
本文分析基於公開市場數據與平台聲明,觀點純屬個人,不代表任何機構立場。





