了解最新公司動態(tài)及行業(yè)資訊
文檔介紹 本文檔根據(jù)愛特項目服務(wù)器硬件設(shè)備和系統(tǒng)應(yīng)用的管理要求,總結(jié)了日常維護(hù)內(nèi)容的技術(shù)分類,描述了具體的操作步驟和操作方法服務(wù)器運維技術(shù),積累了服務(wù)器風(fēng)暴處理能力,使其服務(wù)運維。能夠更加主動和可控。本文檔的目的是指導(dǎo)標(biāo)準(zhǔn)的服務(wù)器故障處理方法,將硬件和系統(tǒng)軟故障分開處理。服務(wù)器硬件管理 1.檢測與故障判斷:服務(wù)器硬件主動檢測方式主要有3種:設(shè)備面板指示燈檢測硬件系統(tǒng)日志檢測第三方工具檢測(一)面板指示燈檢測IBM服務(wù)器有、電源指示燈、硬盤/IDE設(shè)備活動指示燈,網(wǎng)卡指示燈,系統(tǒng)過熱報告指示燈。硬盤插槽也有硬盤指示燈。圖解(二)第三方檢測工具檢測IBM診斷工具:IBM服務(wù)器運維技術(shù),IBM2。硬件設(shè)備改變操作標(biāo)準(zhǔn):判斷并判斷最快恢復(fù)時間 服務(wù)器運維管理指南判斷是否有冗余設(shè)置判斷是否需要c盤設(shè)備crash檢查判斷陣列信息判斷數(shù)據(jù)備份是否對其他相關(guān)應(yīng)用有影響制定 方案,保證數(shù)據(jù)和應(yīng)用的可用性 設(shè)備變更 運營設(shè)備 c兼容性測試 應(yīng)用系統(tǒng)運行 測試設(shè)備變更應(yīng)用 服務(wù)器系統(tǒng)管理 Linux系統(tǒng)管理 Linux系統(tǒng)管理1.1平均負(fù)載()1.2c磁盤空間使用率(df1.3進(jìn)程監(jiān)控( ps–ef) 查看應(yīng)用啟動進(jìn)程數(shù)是否正常1.4 顯存監(jiān)控(免費說明:服務(wù)器運維管理指南total:總化學(xué)內(nèi)存使用大小:已使用多少free:如何much is :多個進(jìn)程共享的顯存消耗/:c盤緩存的大小。
第三行(-/+/):used:已經(jīng)使用了多少。免費:有多少可用。 1.5CPU使用率(top) 說明:top提供當(dāng)前運行系統(tǒng),即運行進(jìn)程的實時動態(tài)視圖。默認(rèn)情況下,CPU 使用率最高的任務(wù)排在最前面,每 5 秒刷新一次。 1.610)1.7 日志系統(tǒng)-系統(tǒng)日志(cat/var/log/grep'Jul23')記錄報告信息服務(wù)器運維管理指南)記錄系統(tǒng)啟動錯誤信息——應(yīng)用系統(tǒng)日志服務(wù)器各個應(yīng)用的日志系統(tǒng),如:/var/log/httpd/等監(jiān)控和報告機制。根據(jù)監(jiān)控軟件設(shè)置相關(guān)資源監(jiān)控值和對應(yīng)服務(wù)端口的在線監(jiān)控。如果資源使用率過高或異常,將通過短信報告通知相關(guān)運維人員。運維人員接到報告后,將根據(jù)相應(yīng)的故障情況采取措施。服務(wù)器運維管理指南3.1資源占用過高 當(dāng)資源占用過高時,運維人員登錄服務(wù)器查看導(dǎo)致資源占用過高的原因,并采取調(diào)整措施影響生意。可以停止服務(wù)進(jìn)行故障維護(hù)操作3. 遇到相關(guān)業(yè)務(wù)服務(wù)故障后,查看應(yīng)用后臺日志,從日志中發(fā)現(xiàn)問題,并通知項目負(fù)責(zé)人安排相關(guān)開發(fā)人員配合處理故障。故障解決后整理相關(guān)文件,描述故障原因及處理方法,并給出防止此類故障的具體措施