一、前言
固然運維這個職能范疇對于絕大多數人來說認知模糊,特別是在分布式存儲領域,“運維”常常和“機房”“IDC”等名詞相伴,導致很多異業者對于運維的了解停留在物理層面,以搬運機器、上下架服務器、管理網電等為標桿,好似網管般維護機器運行。事實上運維工程師從工作方式上分為多類,如:運維工程師、運維開發工程師、運維平臺研發工程師、數據庫工程師、數據庫研發工程師等,體現運維能力更多于針對業務的定制化原生工具開發的方面。
運維工程師負責維護并確保整個服務的高可用性,同時不斷優化系統架構提升部署效率、優化資源利用率提高整體的ROI。
伴隨著Filecoin的主網臨近,“運維”重要性的共識在業界基本達成一致,隨著行業布道信息量和內容程度的升級,越來越多的投資參與者也步入理性分析,無論是從Filecoin項目的階段性動態,亦或是對挖礦服務商的甄選,在主網上線的黎明前夕,現階段最重要的運維工程師們,確定準備好了么?
二、初識運維
1.1運維是什么
運維普遍是指互聯網運維,是和研發、測試、系統管理并頭的4大技術部門。
細分來說運維的技術方向包含服務監控技術、服務故障管理、服務容量管理、服務性能優化、服務全局流量調度、服務任務調度、服務安全保障、數據傳輸技術、服務自動發布部署、服務集群管理、服務成本優化、數據庫管理、平臺化的開發、分布式存儲平臺的開發優化等等,分布式是其中很明確的一個技術要領。
同時在運維工作中,運維人員要照顧到Web服務器、監控、自動部署、配置管理、負載均衡、傳輸工具、備份工具、數據庫、分布式平臺、分布式數據庫、容器、虛擬化、安全、問題追查等大而全、小而細的事項。
Raonsecure將發行帶有DID的移動全國退伍軍人卡:金色財經報道,RaonSecure公司宣布,Omni-One分布式身份識別(DID)平臺已應用于韓國國家退役軍人事務部最近開始發行的移動全國退役軍人登記卡。OmniOne DID平臺是一個基于區塊鏈的平臺,由分布式服務器節點和生物識別認證(FIDO)解決方案組成。 當用戶通過移動ID應用申請發放全國退伍軍人登記卡時,全國退伍軍人登記卡會在身份驗證流程結束后發放到申請人的移動ID應用中。發放歷史記錄在基于 RaonSecure 區塊鏈的獨立服務器節點上,無法偽造或篡改。[2023/8/16 21:26:11]
運維工程師通過軟件或命令行實時與第三方系統做數據同步,實現可視化監控平臺與各系統的無縫對接,確保系統數據的精準與穩定,及時處理告警信息,提高動環監控管理效率。
動環監控自2008年出現至今已有十二年的時間,主要包括以下模塊:
配電系統:UPS及直流電源、自備發電機、配電柜、防雷檢測等。
環境系統:空調、溫濕度監測、漏水監測、氣體監測等。
消防系統:煙感、溫感、早期預警系統、其它消防設備等。
保安系統:圖像監控、門禁監控、紅外探測、玻璃破碎探測等。
IT網管監控:網絡設備、PC服務器、操作系統、數據庫及應用等。
除此之外,運維工程師們還需要關注:
聯動控制:電子開關、聯動錄像、數據存儲、運動操控等。
事件記錄:操作記錄、狀態記錄、異常記錄、確認記錄等。
研報:2030年全球區塊鏈消息傳遞應用市場規模預計將超過5億美元:2月1日消息,據市場研究機構Grand View Research發布的最新報告內容顯示,該機構認為到2030年,全球基于區塊鏈的消息傳遞應用程序市場規模預計將達到 5.365 億美元。據悉,2021年時,區塊鏈消息應用的市場估值約為2220萬美元,由北美市場占據主導地位;該報告預測顯示,亞太地區區塊鏈消息應用市場將實現快速增長。
該報告強調了用戶對隱私和安全的日益關注,是用戶選擇采用基于區塊鏈的消息傳遞應用程序的主要原因。[2023/2/1 11:41:43]
異常報警:聲光報警、語音廣播、電話報警、短信報警、郵件通知等。
運維人的一天從上班打卡開始到下班打卡結束,忙忙碌碌周而復始,“007”的工作模式屢見不鮮。
1.2運維發展史
運維要做的是將系統運行存在的變量做到可控,但運維環境的異構和復雜化導致日常運維工作需要付出的人力、時間成本越來越高。
從初級運維發展到最高新的智能化運維,主要是四個階段的過渡:
腳本時代
工具時代
自動化時代
智能化時代
兩年前,“智能化運維”開始被大家廣泛關注,隨著大數據分析、APM、智能異常檢測、機器學習等技術的興起和逐漸成熟,運維需求也逐漸向自動化和智能化過渡。
三、自動化的意義
2.1自動化的運維方式
自動化是智能化的前提。自動化的運維方式解決硬件和網絡的自動管理、虛擬機的自動管理、操作系統和軟件的自動化安裝、配置,我們看到了很多“管理”,自動化的意義一方面是提高效率、優化成本、優化資源,更好的做一些彈性,把資源釋放出來去干點別的;另一方面更是將運維結果標準化可復制。
OlympusDAO社區投票贊成將7700萬枚DAI部署至DAI儲蓄利率賺取策略DSR:1月23日消息,OlympusDAO社區已通過治理投票贊成將7700萬枚DAI部署至DAI儲蓄利率賺取策略(DSR)。OlympusDAO表示,MakerDAO最近將DAI儲蓄率(DSR)提高到1%,Olympus金庫作為最大的DAI持有者之一,應該利用新的儲蓄率來增加收入。OlympusDAO建議先將100萬枚DAI從儲備金存入DAI儲蓄率模塊,2周后再跟進存入7600萬DAI存款。[2023/1/23 11:26:57]
當然,從工具化到自動化的過程并沒有那么的容易,對整個行業來講,目前更多的工作是在探尋自動化,深耕分布式存儲多年和Filecoin源代碼近兩年的IPFS原力區作為為數不多的實現自動化運維服務的提供商,在此致敬為行業發展服務努力的技術大佬們。
說回運維,在Filecoin這個領域,標準的運維軟件研發和其他相對傳統的運維軟件不太一樣。比如說阿里從工具化到自動化這個過程中,筆者認為工具化挑戰相對小,即使傳統的運維人員也很容易寫一些工具,比如用Python去寫更多的工具體系。但是如果開發者的工具最終要變成能夠到自動化這個階段,就意味著對工具的要求會越來越高,比如說工具的質量,如果開發者寫出來的工具經常有問題,規模一大就扛不住壓力,這時從人性的角度來講,開發者將會慢慢失去信任感,最后會很難完成這個過程。
當自動化運維實現監控、問題診斷、可視化等,運維人只留下一部分手工任務包括容災切換、應急操作、應用部署和起停等,這樣留下的大量精力就可以傾注于運維開發,給用戶帶來更好的服務體驗。
數據:200,000,000枚USDC從USDC Treasury轉移到Coinbase:金色財經報道,據Whale Alert監測數據顯示,200,000,000枚USDC(價值約200,199,999美元)從USDC Treasury轉移到Coinbase。[2022/12/30 22:15:34]
2.2實現自動化的方式。
一套完善的綜合動環監控系統可以對分布的各個獨立的動力設備、機房環境、安保監控等進行實時采集、實時監視系統和設備、安保的運行狀態,記錄和處理相關數據;及時偵測故障,并作必要的遙控遙調操作,適時通知駐場和遠程運維處理;實現機房的少人甚至無人值守,以及電源、空調的集中監控維護管理,提高供電系統的可靠性和通信設備的安全,為機房的管理自動化甚至智能化和決策科學化提供有力的技術支持。
但目前Filecoin領域業內真正的自動化運維的落地實踐占比不大,突出的、原生的定制運維系統更是少之又少,原力礦池占其一。
四、運維對Filecoin的重要性
3.1DEVOPS理念
3.1.1DevOps的工作原理
在DevOps模式下,開發團隊和運維團隊不再“孤立”,他們會在應用程序的整個生命周期內相互協作,開發出一系列不限于單一職能的技能。這些團隊會使用實踐經驗自動執行之前手動操作的緩慢流程,使用能夠幫助其快速可靠地操作和發展應用程序的技術體系和工具,進一步提高團隊的工作速度。
3.1.2DevOps的文化理念
向DevOps的過渡需要文化理念和心態上的轉變。DevOps的宗旨是消除兩個傳統上孤立的團隊之間的壁壘。他們力求頻繁溝通、提高效率,并改善客戶服務的質量,他們能夠完全掌控自己的服務,并且經常越過自己的既定角色或職能的傳統工作范疇,思考最終用戶的需求以及解決這些需求。
三箭資本清算人尋求以3000萬美元價格出售Su Zhu的游艇“Much Wow”:12月3日消息,加密對沖基金三箭資本 (3AC) 清算人表示,目前該基金在新加坡銀行持有的3560萬美元現金已經被沒收,同時還設法從代幣銷售中追回數百萬美元和數量不詳的60種不同的加密代幣和 NFT,并且希望法院批準可以3000萬美元價格出售Su Zhu的游艇“Much Wow”。據此前Terra研究員FatMan披露,Su Zhu擁有的這艘游艇價值5000萬美元,但三箭一直無法支付首付之外的費用。(彭博社)[2022/12/3 21:20:26]
3.1.3DevOps實踐說明
有一些重要的實踐經驗能夠通過自動實施和簡化軟件開發與基礎設施管理流程,幫助組織加快創新速度,這些實踐經驗有大部分需要通過適當的工具來完成。其中一個基本實踐經驗就是要頻繁地進行小規模更新。
這是組織能為客戶快速提供創新的有效方式。與傳統發布實踐中偶爾的更新相比,這種更新通常更具漸進性質。頻繁的小規模更新能夠降低每次部署的風險。它們可以幫助團隊更快速地處理錯誤,因為團隊能夠確定引發錯誤的最近一次部署。雖然更新的節奏和規模可能有所不同,但使用DevOps模式的組織與使用傳統軟件部署實踐的組織相比,會更頻繁更新。
此外,組織還可以使用微服務架構來提升應用程序的靈活性,從而加快創新步伐。微服務架構將大型的復雜系統拆分為簡單的獨立項目。應用程序被拆分為許多單個組件,每個服務限定到單個目的或功能,這些服務既可以與其同級服務相互獨立運行,也可以與應用程序一起作為整體運行。這種架構降低了更新應用程序的協調開銷,當每個服務都與掌控各項服務的敏捷小型團隊一一對應時,組織就可以實現更快的發展。
但是,微服務與較高的發布頻率相結合會導致部署量大幅度增加,會帶來運維挑戰。因此,持續集成和持續交付等DevOps實踐經驗有助于解決這些問題,讓組織能夠以安全可靠的方式快速交付。與基礎設施即代碼和配置管理一樣,基礎設施自動化實踐經驗也有助于維持計算資源的彈性和對頻繁變更的適應性。此外,進行監控和記錄這一實踐經驗可幫助工程師追蹤應用程序和基礎設施的性能,以便他們快速應對出現的問題
3.2Filecoin運維與傳統運維的區別
Filecoin礦商的運維相較傳統互聯網運維難度呈數倍甚至數十倍提升,這主要受挖礦模式影響,比如當用整機串聯并行方式參與時,難度僅圍繞單一固件上的程序穩定性做工,但如果采用集群化或者分布式礦池的形式,集群間的各種請求調度和需求分鐘級部署的高標準對于運維工程師來說是一大挑戰。當Filecoin全網算力需求急劇提升時,集群化礦池模式的運維依然可以自如面對,而其他模式的運維就需要堆人堆資源來解決此類情況。
如果說Filecoin運維和傳統運維的具體不同,這里舉幾個方向的例子:
物理層:因類似阿里云的服務商,沒有標準化的服務支持,Filecoin云服務更需要注重底層架構,需要定制化的自建IDC,這遠遠不止硬件范疇。
SaSS:Filecoin軟件服務層也需要大量運營工具以支持數據可視化,這樣運維需要將開發平臺化,將工具可視化,這個過程中運維參與了大量的研發工作。
運維流程:傳統運維因參與個體少、邏輯簡單,多以Web形式訪問接口,做好端口監聽,反饋結果基本可控絕大多數變量,流程簡單;而Filecoin流程復雜,需要維護的模塊多、自動化難度高、監聽數據復雜且高頻,特別是懲罰機制,猶如達摩克立斯之劍,時刻告誡礦工們即使如此難度也不容出錯,客戶的數據存儲需求服務是Filecoin第一要務。
準確性:運維需要物理層監控,但對于Filecoin來說,監控出塊時間、出塊率、算力走勢、Lotus同步高度準確性等維度的重要程度不亞于物理層運行狀態。在傳統運維場景下,一個異常處理的要求可能在小時級,千萬級用戶的應用服務可能在分鐘級,但Filecoin網絡任何一個參數的異常都有可能對礦工造成巨額收益的損失及抵押的懲罰,易造成得不償失的情況。
除此之外,原力區運維要針對官方的Lotus代碼給予優化,考驗運維的開發能力、程序運行結果的穩定性,要實現健康狀態檢查、故障自動重啟、故障自愈等,這一切的一切為的是提升CPU使用率,從而提升算力、出塊量、收益,效率提升達2-3倍。
3.3項目發布的區別
3.3.1頻率
傳統互聯網項目發布的頻率固定、時間固定,如每周三,部署的原因多為修復BUG及功能新增,而就當前Filecoin網絡狀況,目前原力運維要做到的是靈活部署、隨時可部署、隨時更新鏈版本,實現在第一時間可以推倒已有集群,并重新部署一遍全流程,對于任何細節的調整要有數十倍的復查測試,實現對網絡變化的快速反應,這也是實現實時最優挖礦收益的前置準備。
3.3.2顆粒度
Filecoin挖礦服務在實現數據監控可視化、運維應用狀態監控可視化之外,顆粒度也是極細,比如做Sector的過程中自動化監控P1-P7狀態及返回值。
當原力區運維工程師將數據化、自動化、精細化、平臺化顆粒度足夠精細后,海內外的自動化部署即達到分鐘級執行完畢,通過后臺一鍵管理全部服務器,并行部署新代碼,自動化工具壓縮部署時間,實現節省99%耗時的效率優化,這少則百兆的數據包的分鐘級遠程部署對行業來說是一個挑戰,對Filecoin礦池技術的推進卻是一個跨越。
五、自動化大體量運維
Filecoin大礦工測試中原定“5PB”的大礦工標準,在目前看來對行業已然不是挑戰,據評估Filecoin主網在上線前3-6個月將達到1000PB,這個數據帶來的是Filecoin運維工程師們提前準備的一項作業:如何大體量運維?
目前看來自動化運維是解決大規模集群運維的唯一方式,也是運維工程師面對的最大挑戰。如何管理好幾十萬臺服務器上的服務,同時保障服務的高可用性,這里需要集群復制能力,但相較傳統運維項目,復制部署復雜度數十倍增長。做好24小時駐場維護保障設備上架;高頻定時環動監控及日志記錄保障設備運行;自動化分布式部署、分布式監控系統保障系統運行;核心網絡監控,護航設備&系統&應用連通率;成熟的1保5冗余保護策略保障數據安全;攻防防護保障等等等等,這依然遠遠不夠,運維的路很長,沒有盡頭……
六、總結
當我們翹首以盼的主網來臨,Filecoin開發工程師將逐漸歸隱,Filecoin的發展終將交付于社區,網絡運行狀況且看大礦工的運維工程師們的本領。
在太空競賽這最后一關,運維工程師們的忙碌將得以回報,具體當前未可知,我們且看8月25日。
IPFS研習社專注IPFS/Filecoin研究,歡迎添加微信交流:XF2020IPFS
親愛的BKEXer:?? ??? BKEXGlobal即將上線OSST,詳情如下:??上線交易對:OSST/USDT?充值功能開放時間:2020年8月24日20:00交易功能開放時間:2020年.
1900/1/1 0:00:00文章系金色財經專欄作者牛七的區塊鏈分析記供稿,發表言論僅代表其個人觀點,僅供學習交流!金色盤面不會主動提供任何交易指導,亦不會收取任何費用指導交易,請讀者仔細甄別,謹防上當.
1900/1/1 0:00:008.24繁華論幣:BTC多頭有望回暖,日內以回調看多為主。繁華論幣/zsjj518 前言: 交易一周又一周,解套一個又一個,我愿意幫的,你愿意聽的,熬夜都不算什么,投資本來就是副業,看得開的是興.
1900/1/1 0:00:00資金面分析: :大餅昨天648開635收,高低點差都不到200點,實在沒什么好說的,昨天上午給出的11500-11450的多單布局差15個點到達進場點位,有點可惜.
1900/1/1 0:00:00在有爭議的大選讓現任總統AlexanderLukashenko重新掌權后,抗議和罷工仍在繼續。根據BelarusEconomy發布的Telegram帖子,Lukashenko政權將對外匯和銀行業.
1900/1/1 0:00:00BTC行情分析;1小時級別看幣價不斷突破布林下軌,不斷試探下方,RSI指標MA5均線呈向下趨勢,KDJ三線呈向下發散空頭趨勢,MADC紅色能量放能.
1900/1/1 0:00:00