Page 1 of 1

並優先考慮多項措施

Posted: Sun Dec 15, 2024 9:27 am
by si.nf.o.2.69
報告稱,遙測服務部署四分鐘後,發生了中斷,因為它導致執行資源密集型 Kubernetes API 操作,導致 Kubernetes API 伺服器不堪重負,並導致大多數 OpenAI 大型叢集中的 Kubernetes 控制平面癱瘓。根據報告,OpenAI 在幾分鐘內檢測到並識別了該問題並開始修復。

報告稱,該公司正在實施來防止類似 電子郵件數據 事件,包括改善分階段推出以及更好地監控基礎設施變更。報告稱,我們對這起事件對我們所有客戶(從 用戶到開發人員,再到依賴 OpenAI 產品的企業)造成的影響表示歉意。我們沒有達到自己的期望。

Image


OpenAI 在6 月經歷了所有 相關服務長達3 小時的中斷,並在11 月高調宣布開設新商店兩天后, 經歷了短暫但嚴重的中斷。用戶數為100 萬每天都有十億條用戶訊息在人工智慧聊天機器人上發送,並且美國有數百萬開發人員在 OpenAI 上進行開發。