AIOps平臺旨在減少警報疲勞
AIOps似乎對哭泣的狼感到高興–白天和黑夜,鈴聲四起,通知IT站點可靠性工程師(SRE)可能有問題?;虿弧T基礎結構越大,越復雜,對誤報和“警報噪聲”的響應就浪費了更多的時間和精力,從而使IT團隊無法解決需要修復的實際問題。
用于定制軟件開發(fā)的基于云的“可觀察性平臺”的制造商New Relic今天宣布,去年收購事件智能廠商SignifAI取得了豐碩的成果,并發(fā)布了用于呼叫DevOps,SRE和網(wǎng)絡運營的AIOps套件。中心IT團隊。據(jù)該公司稱,它被稱為New Relic AI,它應用AI和機器學習來幫助檢測和解決IT事件,并不斷改善事件管理工作流程。
行業(yè)分析公司MarketsandMarkets報告稱,到2023年,AIOps平臺市場預計將增長到110.2億美元,Gartner預測在三年內(nèi),將有40%的DevOps團隊將利用AIOps功能。該技術解決了不斷受到壓力的IT團隊的迫切需求,以滿足服務水平目標并快速識別和解決日益復雜的IT環(huán)境中的問題。
Gartner高級總監(jiān)分析師Padraig Byrne說:“ AIOps將檢測出人類不太可能發(fā)現(xiàn)的模式,包括那些揭示因果關系的模式。在確定因果關系之后,應該創(chuàng)建模型,以幫助確定哪些IT指標。應該映射到哪個業(yè)務目標。隨著時間的推移觀察這些以完善每個模型;確保它是最新的,并確保它所做的任何假設都正確。通過使用機器學習算法,AIOps特別提供了一種數(shù)學方法來查找使該過程成為可能的數(shù)據(jù)中隱藏的聯(lián)系,原因和機會。”
New Relic產(chǎn)品營銷總監(jiān)Michael Olson告訴我們,隨著IT環(huán)境和驅(qū)動它們的軟件的擴展和現(xiàn)代化,“需要管理的范圍很廣,這些團隊正在收到越來越多的警報要處理,這使得很難對最重要的問題進行優(yōu)先排序,將信號與噪音分開,并專注于對采取行動最重要的問題。”
簡而言之,AIOps需要變得更聰明。
他說:“這實際上是我們看到New Relic AI能夠提供幫助的地方,通過分析您可以從多個來源獲取的數(shù)據(jù),將彼此相關的警報,事件和事件進行分組和關聯(lián),以及,最終……幫助我們的客戶專注于最高優(yōu)先級的問題。” 他說,搶先體驗的客戶報告稱,警報噪音和“警報疲勞”降低了50%以上。
該公司將New Relic AI描述為“一個開放的事件關聯(lián)和情報解決方案,它與源和數(shù)據(jù)無關”,并利用了New Relic的統(tǒng)一遙測數(shù)據(jù)庫,該數(shù)據(jù)庫為ML模型提供了動力,并提供了“上下文關聯(lián)事件響應工作流程”,可減少警報噪聲。
奧爾森說,New Relic AI的一項關鍵功能是將其集成到現(xiàn)有管理工作流程中,例如Slack,PagerDuty,ServiceNow,OpsGenie,VictorOps和其他廣泛使用的工具。該公司表示,客戶可以實時查看攝取的數(shù)據(jù),事件摘要,并可以“??根據(jù)用戶反饋調(diào)整相關性”。
遙測數(shù)據(jù)不斷通過New Relic AI饋送以進行異常檢測。據(jù)該公司稱,該平臺可提取,分析多種數(shù)據(jù)類型并采取行動,包括警報,日志,指標和部署事件,從而為“團隊提供更好的事件背景信息……以及它們?nèi)绾斡绊懜鼜V泛的環(huán)境,以便他們能夠進行診斷和更快地確定問題的優(yōu)先級。”
該公司表示,通過關聯(lián)相關的警報,事件和事件,減少了警報噪聲,同時“還抑制了震蕩和低優(yōu)先級警報。關聯(lián)事件豐富了上下文,并根據(jù)黃金信號(即錯誤,飽和度,流量,等待時間)自動分類,并識別受影響的相關組件并建議響應者,以幫助待命團隊更接近根本原因并更快采取行動。”
Olson補充說,New Relic AI旨在提高透明度。
他說:“我們?yōu)榭蛻籼峁┝藰O大的透明度和靈活性,并控制了事件之間的關聯(lián)方式……然后,我們實際上為客戶提供了靈活性和控制力,以便能夠?qū)⑵渥约旱南到y(tǒng)注入到系統(tǒng)中。人為決定并調(diào)整相關邏輯。這樣一來,我們的客戶就能夠更好地了解問題之間的相關性,并最終對系統(tǒng)產(chǎn)生更高的信任度。”
標簽: AIOps平臺