為什么持續(xù)可用性對云計算很重要
為什么持續(xù)可用性對云計算很重要?
目前,近乎所有的企業(yè)組織都在采用某種形式的云計算。這些努力包括將應用程序或工作負載首次轉(zhuǎn)移到云計算平臺,將云和本地活動融合到混合云平臺,或依托于微服務和API的云原生應用架構。
在所有這些變體中,幫助企業(yè)組織確保其服務和應用的性能和可用性的傳統(tǒng)工具都失敗了。愈來愈多的人需要更現(xiàn)代化的工具來提供更好的可觀察性和對正在發(fā)生的事情的洞察力,以及依托于AI的輔助來幫助確保持續(xù)可用性和一流的性能。
當前有幾個問題推動了對現(xiàn)代工具的需求。首先,組織在云環(huán)境上部署應用程序和運行工作負載的復雜性增加。
即使是一個簡單的應用程序,譬如為用戶帳戶提供移動前端,也會涉及到企業(yè)維護的后端元素、公共云上的數(shù)據(jù)庫、通過用戶提供商的連接,以及任何一個主要的移動操作系統(tǒng)。各種元素之間存在很多相互依賴關系,業(yè)務部門對大多數(shù)可能影響性能或可用性的元素近乎沒有控制權。當出現(xiàn)問題時,可能需要花費大量時間來確定中斷的來源。使用AIOps的現(xiàn)代可觀察性工具可以幫助自動化根本原因分析,加速停機或其他問題的修復(MTTR)。這可以顯著減少修復/恢復的時間。
第二,企業(yè)組織不能再被動,在問題發(fā)生后采取行動。傳統(tǒng)的IT管理方法是等待來自客戶或內(nèi)部用戶的的關于服務中斷或服務質(zhì)量差的投訴電話。AIOps提供了一種更具有預測性的操作模式。其支持一種主動的方法,可以發(fā)現(xiàn)丟棄或重發(fā)數(shù)據(jù)包的增加,以及其他性能不佳的指標,并實時采取糾正措施。
第三,當應用程序和服務使用多個云元素交付時,安全性將更具挑戰(zhàn)性,其中一些云元素不受企業(yè)的控制。有了現(xiàn)代的可觀察性工具,安全團隊可以使用AIOps來發(fā)現(xiàn)異常,這些異常是攻擊或預示數(shù)據(jù)泄露的活動的前兆。比如,AIOps可以用來提醒安全團隊,有大量的數(shù)據(jù)正在通過一個通常很少使用的端口從組織中發(fā)送出去。
持續(xù)可用性對于滿足最終用戶的期望至關重要
應用程序性能和可用性對于任何組織都非常重要。員工有一定的期望,即他們完成工作所需的應用程序和服務能在他們需要的時候隨時可用,并且表現(xiàn)良好。
同樣,目前任何面向客戶的應用程序或服務都面臨著更苛刻的用戶期望。由于人們習慣于在需要的時候立即獲得任何東西,所以對于那些無法獲得或性能較差的產(chǎn)品,近乎沒什么容忍度。
很多研究已經(jīng)量化了任何問題對底線的影響。40%的用戶會放棄加載時間超過3秒的網(wǎng)站,53%的用戶會放棄無法在3秒內(nèi)加載的手機應用。
如果某個網(wǎng)站或手機應用無法使用或表現(xiàn)不佳,用戶就會放棄該網(wǎng)站或應用。這就會導致收入損失。比如,在線購物的客戶只需跳轉(zhuǎn)到另一個商家的網(wǎng)站下一次性訂單。如果客戶在該網(wǎng)站上有良好的體驗,那么他們可能永遠不會再回來了。所以,這不單單是一次購買的損失。這可能意味著失去一個終身客戶。
相比之下,緩慢的性能推動著業(yè)務的發(fā)展。Google對該問題的一項經(jīng)典分析發(fā)現(xiàn),53%的用戶放棄了加載時間超過3秒的站點。事實上,網(wǎng)站和移動應用的性能非常重要,Google現(xiàn)在把這兩個因素都納入了SEO排名。這同樣會對財政收入產(chǎn)生嚴重影響。想象一下,從頁面上的Google排名第二下降到搜索結果的第一頁,那么當客戶尋找其產(chǎn)品或服務時,永遠不會看到這家公司。
現(xiàn)代商業(yè)所需要的工具
目前,持續(xù)可用性和優(yōu)化性能至關重要。確保兩者兼顧的一種方法是使用可觀察性與AIOps相輔相成,AIOps是任何數(shù)字組織在云環(huán)境中運行時都需要全天候運行的基本層。
AIOps是部署機器學習來跟蹤來自傳感器、軌跡、日志和其他來源的數(shù)據(jù),以防止內(nèi)部和外部中斷,無論是通過事件關聯(lián)還是異常檢測。其還可以通過確定傷亡人數(shù)來更好地分析事件發(fā)生的原因。
高級AIOps平臺匯集所有數(shù)據(jù)——指標、跟蹤、日志、更改和事件——以實現(xiàn)快速、準確的報告和分析。與過去的、依托于規(guī)則的技術不同,這種方法可以對部分證據(jù)進行操作,并在問題變得嚴重之前發(fā)現(xiàn)問題。AIOps還使用機器學習來分析事件,了解怎樣在事件生命周期的早期發(fā)現(xiàn)問題,并確定推動持續(xù)可用性的模式。
考慮到2022年依托于云計算的數(shù)字組織的復雜性,以及多層微服務和臨時架構,AIOps對于尋求確保應用和服務可用且性能良好的努力至關重要。