www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

Google 的運(yùn)維人員如何進(jìn)行問題排查?

2018-01-15 17:02:04 高效運(yùn)維 關(guān)注  點(diǎn)擊量: 評(píng)論 (0)
前言今天我們來聊聊問題排查這個(gè)話題,本人到目前為止還在參與一線運(yùn)維的工作,遇到過很多稀奇古怪的線上故障和問題,結(jié)合SRE中給出的一些

前言

今天我們來聊聊“問題排查”這個(gè)話題,本人到目前為止還在參與一線運(yùn)維的工作,遇到過很多“稀奇古怪”的線上故障和問題,結(jié)合SRE中給出的一些方法,來說說“問題排查”那點(diǎn)事。

 

排查問題不是玄學(xué)

排查出線上問題,并找到根本原因加以解決,是一件很有成就感的事情,曾經(jīng)有人問過我,“你是怎么想到問題出現(xiàn)在xxx的?又是怎么確認(rèn)根本原因是xxx的?”,我只能淡淡的說:“靠經(jīng)驗(yàn)”,然后感覺這個(gè)逼裝的自己還算滿意。

其實(shí)這個(gè)“靠經(jīng)驗(yàn)”說的很模糊,一直以來,大家都覺得排查問題要靠經(jīng)驗(yàn),但是又說不出具體通過啥經(jīng)驗(yàn)排查出了問題,最后讓排查問題逐漸變成了一門玄學(xué)。

 

排查問題猶如破案

排查線上問題,就和偵探破案一樣,就是一個(gè)不停分析線索,推理的過程,在你準(zhǔn)備破案之前,先要明確以下兩點(diǎn)。

 

系統(tǒng)異常是正常的,正常是特例

時(shí)至今日,計(jì)算機(jī)系統(tǒng)已經(jīng)變得異常復(fù)雜,一次用戶請(qǐng)求可能要經(jīng)過發(fā)送請(qǐng)求,DNS解析,運(yùn)營商網(wǎng)絡(luò)和IP轉(zhuǎn)換,負(fù)載均衡,服務(wù)器硬件,虛擬機(jī)/容器,視業(yè)務(wù)邏輯的復(fù)雜程度,可能還要調(diào)用其它組件,存儲(chǔ),數(shù)據(jù)庫,緩存等。每個(gè)環(huán)節(jié)都可能出現(xiàn)問題,有的組件又是分布式的,大大增加的排查問題的難度。

所以出現(xiàn)問題后,不要著急,保持好心態(tài),要認(rèn)為“系統(tǒng)異常是正常的,正常是特例”。

 

飛行員首要任務(wù)是保持飛機(jī)飛行

在初級(jí)飛行員的課程中撿到,在緊急情況中,飛行員的首要任務(wù)是保持飛機(jī)飛行,相比保證乘客與飛機(jī)安全著陸,故障定位和排除是次要目標(biāo)。—SRE

所以,恢復(fù)線上系統(tǒng)是首要任務(wù),而不是找到它發(fā)生的原因。

 

明確案情

先評(píng)估出這個(gè)問題的影響范圍,是全網(wǎng)用戶不可用,還是某些用戶,是某條業(yè)務(wù)線出現(xiàn)問題,還是很多業(yè)務(wù)線都出現(xiàn)問題,評(píng)估出案情的大小,是普通的民事案件,還是刑事案件。

 

真相只有一個(gè)

計(jì)算機(jī)是一門科學(xué),而且計(jì)算機(jī)是由0|1組成的世界,在這個(gè)世界里只有“是或否”,沒有中間地帶,所以在計(jì)算機(jī)世界“凡事都有根本原因”,“沒有偶然發(fā)生,一切都是必然”。

所以,你要堅(jiān)信真相只有一個(gè)。

 

理清線索

理清目前得到的線索和信息,比如監(jiān)控上有網(wǎng)絡(luò)報(bào)警,有用戶反饋無法訪問,有開發(fā)人員反饋服務(wù)器有問題,不要漏掉看似無關(guān)緊要的線索,把這些線索先整理下來,后面一并分析。

 

擴(kuò)大信息量

盡可能擴(kuò)大你接受到的信息量,比如問詢一下開發(fā)人員今天有沒有做線上改動(dòng),網(wǎng)絡(luò)組有無重大調(diào)整。獲取到有價(jià)值的信息,對(duì)于排查問題至關(guān)重要。

查看監(jiān)控,細(xì)看某個(gè)監(jiān)控項(xiàng)的變化,追蹤日志和調(diào)試信息都是擴(kuò)大信息量的手段。

 

分析證詞

分析用戶反饋的現(xiàn)象,數(shù)據(jù)是可信的,有時(shí)候人說的是不可信的,舉個(gè)例子,之前有開發(fā)反饋我們虛擬機(jī)有問題,有些虛擬機(jī)接口返回異常,有些正常,他就讓我們幫查查虛擬機(jī)的問題,但是最后是代碼調(diào)用一處動(dòng)態(tài)配置造成的。

很多反饋的信息描述,是經(jīng)過描述者過濾加工過的信息,他的排查和分析有可能把你“帶歪了”,先要用懷疑的態(tài)度,分析每個(gè)人的證詞。

 

當(dāng)你聽到蹄子聲響時(shí),應(yīng)該先想到馬,而不是斑馬

排查問題不要先入為主,有時(shí)候你覺得極其簡單,看似非常不可能發(fā)生的事情,可能就是原因,不要輕易的排除掉某項(xiàng)原因,比如“宇宙射線導(dǎo)致某個(gè)電路信號(hào)出錯(cuò)”。

我們之前有個(gè)mysql連接異常的問題,查了很久,做了很多調(diào)優(yōu)都沒有解決,最后發(fā)現(xiàn)是網(wǎng)卡跑滿了。

 

從大到小,從上到下

排查步驟,先“從大到小”,先看比如運(yùn)營商網(wǎng)絡(luò),機(jī)房狀態(tài)等比較宏觀的地方是否有問題,逐一排除,逐步縮小問題范圍。“從上到下”,先從現(xiàn)象發(fā)生的頂端調(diào)用鏈逐一排查,逐步向下深入。

 

SRE給出的一些方法

SRE給出了一些方法可以借鑒:

  • 問題排查的幾個(gè)步驟:定位,檢查,診斷,測試/修復(fù),治愈。

  • 什么,哪里和為什么,找出系統(tǒng)正在執(zhí)行“什么”,詢問系統(tǒng)“為什么”執(zhí)行這些操作,以及系統(tǒng)的資源都被用在了“哪里”可以幫助你了解系統(tǒng)為什么出錯(cuò)。

  • 確定“最后一個(gè)修改”發(fā)生的時(shí)間。

  • 提供豐富的診斷和監(jiān)控工具。

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:售電衡衡

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
?
主站蜘蛛池模板: 亚洲视频在线观看网址 | 亚洲国产二区三区 | 久在线观看 | 亚洲 欧美 日韩 在线 中文字幕 | 宅女深夜福利视频在线 | 成人爽爽大片在线观看 | 国产欧美日韩视频在线观看 | 怡红院在线观看视频 | 国产麻豆一级在线观看 | 欧美一级视频在线观看 | 国产成人91一区二区三区 | 国产成人午夜 | www欧美com| 在线观看欧洲成人免费视频 | 亚洲不卡在线观看 | 精品国产理论在线观看不卡 | 欧美三级网 | 国产一区二区三区亚洲综合 | 久久99久久99精品免观看 | 97精品国产91久久久久久久 | 国产91成人 | 国产东北色老头老太性视频 | 黄色免费三级 | 我们2018在线完整免费观看 | 久久精品国产精品亚洲艾 | 色老头一级毛片 | 玖草在线播放 | 大片毛片女女女女女女女 | 久草网视频在线观看 | 亚洲国产精品综合久久久 | 好吊操这里只有精品 | 99热久久国产这里是精品 | 一区二区三区观看 | 日韩欧美一级毛片视频免费 | 亚洲国产亚洲片在线观看播放 | 亚洲高清中文字幕一区二区三区 | 日韩三级视频在线 | 日本免费一区二区三区毛片 | 特级毛片全部免费播放a一级 | 亚洲 欧美 日韩 在线 中文字幕 | 亚洲国产国产综合一区首页 |