(資料圖片僅供參考)
沒有100%的穩(wěn)妥,但大廠的宕機(jī)來得還是如此頻繁。5月11日,蘋果iCloud賬戶與登錄、iCloud郵件等功能在15:27-16:10發(fā)生超過40分鐘服務(wù)故障,雖然只是部分用戶,但影響范圍遍及全球。
蘋果不是第一個(gè)被用戶質(zhì)問的大廠。與蘋果同為海外科技巨頭的Facebook,過去幾年也屢出事故,2021年10月4日和8日,F(xiàn)acebook連續(xù)兩次出現(xiàn)全球性宕機(jī),合計(jì)時(shí)長(zhǎng)超過9個(gè)小時(shí)。在國(guó)內(nèi),最近半年時(shí)間,阿里云、微信等大廠先后發(fā)生產(chǎn)品故障。2022年12月中旬阿里云香港機(jī)房宕機(jī)超過10個(gè)小時(shí);2023年3月底,微信、QQ等業(yè)務(wù)出現(xiàn)大面積功能異常。
由于產(chǎn)業(yè)鏈縱深關(guān)聯(lián),大廠宕機(jī)帶來的影響是實(shí)打?qū)嵉?。這就難怪今年4月12日,工信部信息通信管理局聽取騰訊關(guān)于“3·29”微信業(yè)務(wù)異常情況匯報(bào),要求騰訊堅(jiān)決避免發(fā)生重大安全生產(chǎn)事故,切實(shí)提升公眾業(yè)務(wù)安全穩(wěn)定運(yùn)行水平。
宕機(jī)引發(fā)用戶關(guān)注,考驗(yàn)大廠的態(tài)度,更考驗(yàn)大廠的能力。以往外界想當(dāng)然或者大廠自我標(biāo)榜的安全水平,在現(xiàn)實(shí)面前不堪一擊。
宕機(jī),一方面沖擊用戶對(duì)企業(yè)的信任度:如騰訊、蘋果這般數(shù)千億上萬億美元的企業(yè),有人才有資金有技術(shù),何至于還會(huì)發(fā)生這些技術(shù)故障?如果態(tài)度沒問題,能力就無法自圓其說;另一方面,科技大廠代表的不只是自己,還是新技術(shù)新趨勢(shì)的引領(lǐng)者。阿里云香港機(jī)房的長(zhǎng)時(shí)間故障,嚇壞了自家客戶,也給云計(jì)算“是否真的那么好”蒙上了一層不確定。
宕機(jī)真的不可避免嗎?以現(xiàn)階段的主流技術(shù)方案,答案是殘酷的,宕機(jī)真的無法避免。原因多種多樣,最核心的一點(diǎn)無法避開:不管本地計(jì)算還是云計(jì)算,互聯(lián)網(wǎng)服務(wù)最終指向的都是數(shù)據(jù)中心。而全球多數(shù)數(shù)據(jù)中心仍以中心化數(shù)據(jù)儲(chǔ)存機(jī)制為主,批量計(jì)算機(jī)和服務(wù)器組成中心節(jié)點(diǎn),這種物理屬性決定了數(shù)據(jù)中心無法規(guī)避外界因素,也就無法做到永不宕機(jī)。
對(duì)宕機(jī)無法容忍,卻無法做到永不宕機(jī),企業(yè)能努力的就是災(zāi)備,上述大廠的宕機(jī)事故,恰恰是災(zāi)備能力沒有達(dá)到預(yù)想中的狀態(tài)。
某種意義上,企業(yè)越大,產(chǎn)品(功能)越多,技術(shù)越新,發(fā)生技術(shù)BUG的可能性反而越大。因此,大廠之“大”在產(chǎn)品和數(shù)據(jù)安全層面是把雙刃劍,好的一面是,在與競(jìng)爭(zhēng)對(duì)手的PK中,能夠提供更順滑的用戶體驗(yàn)和信任層面的安全加持;但壞的一面是,新功能新技術(shù)的試水,數(shù)據(jù)指數(shù)級(jí)的起伏,都會(huì)帶來安全事故的概率增大。
有些合乎邏輯的“失誤”能夠理解,比如某個(gè)熱搜發(fā)酵之時(shí)微博的宕機(jī),“雙11”搶購(gòu)潮中的付款擁堵……企業(yè)沒能準(zhǔn)確預(yù)料流量峰值,多加幾組服務(wù)器就能解決。而有些事故之所以成為事故,如開篇所列例子,關(guān)鍵還是大廠的災(zāi)備能力遠(yuǎn)沒有所言得那么強(qiáng)大。
關(guān)鍵詞:
責(zé)任編輯:Rex_12