Linux服務器運維

 系統運維     |      2024-04-28 08:17
運維是指大型組織已經建立好的網絡軟硬件的維護,就是要保證業務的上線與運作的正常。
在他運轉的過程中,對他進行維護,他集合了網絡、系統、數據庫、開發、安全、監控于一身的技術。
運維包括:DBA運維、網站運維、虛擬化運維、監控運維、游戲運維等等。

運維內容:

服務監控技術:包括監控平臺的研發、應用,服務監控準確性、實時性、全面性的保障
服務故障管理:包括服務的故障預案設計,預案的自動化執行,故障的總結并反饋到產品/系統的設計層面進行優化以提高產品的穩定性
服務容量管理:測量服務的容量,規劃服務的機房建設,擴容、遷移等工作
服務性能優化:從各個方向,包括網絡優化、操作系統優化、應用優化、客戶端優化等,提高服務的性能和響應速度,改善用戶體驗
服務全局流量調度:接入服務的流量,根據容量和服務狀態在各個機房間分配流量
服務安全保障:包括服務的訪問安全、防攻擊、權限控制等
服務自動發布部署:部署平臺/工具的研發,及平臺/工具的使用,做到安全、高效的發布服務
服務集群管理:包括服務的服務器管理、大規模集群管理等
服務成本優化:盡可能降低服務運行使用的資源,降低服務運行成本
數據庫管理(DBA):通過設計、開發和管理高性能數據庫集群,使數據庫服務更穩定、更高效、更易于管理。
平臺化的開發:類docker等平臺的開發管理,及服務接入技術

 Linux運維工作分類
1、應用運維(SRE):
應用運維負責線上服務的變更、服務狀態監控、服務容災和數據備份等工作,對服務進行例行排查、故障應急處理等工作
工作職責如下:設計評審、服務管理、資源管理、例行檢查、預案管理、數據備份。
2、系統運維(SYS):
負責IDC、網絡、CDN和基礎服務的建設(LVS、NTP、DNS);
負責資產管理,服務器選型、交付和維修,網絡建設、LVS負載均衡和SNAT建設
3、運維開發
是給應用運維開發運維工具和運維平臺的
主要包含的平臺:工單系統、CMDB、監控系統、ELK日志系統、CI/CD、LDAP、FAQ、培訓系統、OpenStack平臺
4、數據庫運維(DBA):
數據庫運維負責數據存儲方案設計、數據庫表設計、索引設計和SQL優化,
對數據庫進行變更、監控、備份、高可用設計等工作,詳細的工作內容如下
設計評審、容量規劃、數據備份與災備、數據庫監控、數據庫安全、數據庫高可用和性能優化
自動化系統建設、運維研發、運維平臺、監控系統、自動化部署系統
5、運維安全(SEC):
運維安全負責網絡、系統和業務等方面的安全加固工作
進行常規的安全掃描、滲透測試,進行安全工具和系統研發以及安全事件應急處理
工作內容如下:安全制度建立、安全培訓、風險評估、安全建設、安全合規、應急響應。