您的位置:首頁(yè) > 業(yè)內(nèi)資訊 > 谷歌是如何做到幾乎從不宕機(jī)的?

谷歌是如何做到幾乎從不宕機(jī)的?

來(lái)源:互聯(lián)網(wǎng) | 時(shí)間:2016-04-12 13:52:58 | 閱讀:188 |  標(biāo)簽: 谷歌   | 分享到:

某一天,你需要使用Google,但Google并不可用——你上一次遇見(jiàn)這種情況是什么時(shí)候?

谷歌是如何做到幾乎從不宕機(jī)的?

很有可能,這種情況根本沒(méi)有發(fā)生過(guò)(譯注:這文章是美國(guó)人寫(xiě)的)。的確,有時(shí)也會(huì)出現(xiàn)因?yàn)榫W(wǎng)絡(luò)連接中斷而用不上Google的情況;但是Google的基礎(chǔ)性在線服務(wù)——從搜索引擎到Gmail再到Google Docs等等——幾乎永遠(yuǎn)垂手可及。根據(jù)Google官方的數(shù)據(jù),2015年該公司旗下的Google App套件在99.97%的時(shí)間里都處于可用狀態(tài)。也許我們認(rèn)為這是理所當(dāng)然的,但它的確是一個(gè)了不起的事實(shí);而全世界數(shù)十億的Google用戶似乎從來(lái)沒(méi)有停下來(lái)想想:Google是如何把一件如此激動(dòng)人心的事情處理得如此波瀾不驚的。

用軟件取代人工

Google用了這三個(gè)詞來(lái)解釋這個(gè)問(wèn)題:Site Reliability Engineering(中文可譯為:網(wǎng)站可靠性工程,后文簡(jiǎn)稱SRE)。也許這三個(gè)詞聽(tīng)起來(lái)并不是特別性感,但它們確實(shí)是(名字聽(tīng)起來(lái)更不性感)的Google在10年前就已經(jīng)秉承的核心理念。這個(gè)理念很難用一兩句話說(shuō)清楚,不過(guò)可以歸結(jié)到一個(gè)中心思想:讓碼農(nóng)而非那些專門從事網(wǎng)絡(luò)服務(wù)的IT人士來(lái)運(yùn)營(yíng)網(wǎng)絡(luò)服務(wù)。如果這個(gè)思想得以執(zhí)行,那么碼農(nóng)們就會(huì)開(kāi)發(fā)出一種不需要人為介入的工具來(lái)幫助完成運(yùn)營(yíng)工作(這里所說(shuō)的運(yùn)營(yíng),主要是指維護(hù)服務(wù)的穩(wěn)定和性能)。

“我們通過(guò)這種方法建立這樣一個(gè)團(tuán)隊(duì):大家都比較厭倦自己親自動(dòng)手去完成任務(wù),而是通過(guò)寫(xiě)出軟件來(lái)取代此前需要人工完成的事情。”一位名叫Ben Treynor Sloss的Google員工在一篇文章中寫(xiě)道。

對(duì)于硅谷的很多人來(lái)說(shuō),這似乎已經(jīng)成為一個(gè)常識(shí);從亞馬遜到Box.com,這種方法已經(jīng)被整個(gè)科技圈所采用。人們稱其為DevOps(Development加上Operations)模式,意即通過(guò)某種努力將軟件開(kāi)發(fā)者與系統(tǒng)管理員聯(lián)系起來(lái)。但是以Chef和Puppet為代表,自從DevOps模式從Google的SRE漸漸衍生出來(lái)之后已經(jīng)發(fā)生了很大的改變。只不過(guò)Google在過(guò)去的十年里一直對(duì)SRE默不作聲,但是過(guò)去它在應(yīng)對(duì)大規(guī)模高效率的網(wǎng)絡(luò)操作時(shí)的確是這么做的。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認(rèn)同期限觀點(diǎn)或證實(shí)其描述。

相關(guān)視頻攻略

更多

同類最新

更多

掃二維碼進(jìn)入好特網(wǎng)手機(jī)版本!

掃二維碼進(jìn)入好特網(wǎng)微信公眾號(hào)!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]

湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2024 haote.com 好特網(wǎng)