10月14日,雙態(tài)IT烏鎮(zhèn)用戶大會成功舉辦。其間由百度智能云與鼎茂科技聯(lián)合舉辦的專場分論壇,聚集了百度智能云、鼎茂科技、建信金科、上海人工智能研究院、國方創(chuàng)新等企業(yè)、機構(gòu)的各領域?qū)<?#xff0c;以“利用AI大模型技術(shù)加速推進智能運維大腦建設”為主題,圍繞AI大模型在技術(shù)維度、智能運維領域的應用維度、安全合規(guī)等多個角度,分享了最新的實踐經(jīng)驗和前沿探索。
主題專場由躍為資本副總裁宋芃主持。他提到:“當下AI大模型成為多個產(chǎn)業(yè)領域關(guān)注的技術(shù)重點;同時智能運維也在向企業(yè)IT管理的核心發(fā)展,從IT管理擴容到更多的企業(yè)支持領域,新一代的智能運維系統(tǒng)快速向企業(yè)級智能運維大腦升級。此次百度智能云與鼎茂科技等多家機構(gòu)的專場研討,是大模型先鋒技術(shù)和智能運維行業(yè)實踐領域的一次深度結(jié)合,將帶來更多有突破、好借鑒的精彩分享。”
—— 嘉賓分享內(nèi)容梗概 ——
AI技術(shù),尤其是近期熱點的大語言模型突破,能夠給智能運維領域帶來怎樣的加速發(fā)展,備受行業(yè)關(guān)注和期待。如何結(jié)合智能運維相關(guān)的領域知識、聚焦行業(yè)場景,持續(xù)落地相應AI智能化解決方案,已成為業(yè)界探索的目標和方向。這其中有哪些挑戰(zhàn)和可能的技術(shù)路徑?
圍繞這些挑戰(zhàn)和解題思路,鼎茂科技CTO 何誠,分享了《企業(yè)級AIOps落地挑戰(zhàn)及與大模型結(jié)合發(fā)展趨勢》。演講主要圍繞企業(yè)級AIOps端到端智能化解決方案落地的問題和挑戰(zhàn),提出了技術(shù)和解決方案應對思路。同時對AI大模型技術(shù)在智能運維領域的落地探索以及未來發(fā)展趨勢進行了分享。
何誠總首先基于鼎茂多年的實踐經(jīng)驗,剖析了企業(yè)在有效應用AIOps端到端智能化解決方案的過程中面臨的三個挑戰(zhàn):
數(shù)據(jù)的價值密度和標準化程度低,導致實際可用的樣本和數(shù)據(jù)相對較少。
隨著業(yè)務和環(huán)境的變化,數(shù)據(jù)分布和內(nèi)容動態(tài)變化,使得智能化應用方案的動態(tài)適配以及應用經(jīng)驗和領域知識的平滑遷移難度大增。
從IT軟硬件資源到業(yè)務各層之間關(guān)系復雜并且相互影響,跨層多模態(tài)數(shù)據(jù)的統(tǒng)一整合分析極為困難。
接著何誠總分享了鼎茂在應對這些挑戰(zhàn)中采用的有效技術(shù)解決方案以及實踐探索,包括:
設計并實現(xiàn)鼎茂的可觀測指標中心,內(nèi)置IT運維領域豐富的知識體系,以不同角色管理的IT運維對象為視角和運維核心,結(jié)合特定運維數(shù)據(jù)體系實際狀況,分析并優(yōu)化數(shù)據(jù)治理的管理體系和價值體系,實現(xiàn)IT對象之間、對象指標之間、指標數(shù)據(jù)之間的依存和影響狀態(tài)可追查,為智能運維場景降本增效,從而極大提升了數(shù)據(jù)資產(chǎn)價值。
采用多種前沿的終生學習方案,包括在線學習(Online Learning)、增量學習(Incremental Learning)、遷移學習(Transfer Learning)、強化學習(Reinforcement Learning)等,實現(xiàn)智能運維解決方案的持續(xù)學習和接收反饋迭代提升。并將上述關(guān)鍵技術(shù)作為基礎算子能力,集成到鼎茂的AI服務引擎ARCANA-AI Engine中,縮短業(yè)務理解和智能化解決方案實現(xiàn)并落地部署時間。
提出”一橫、一縱、一深入“的跨層根因分析方法體系,通過鼎茂Di-RCA解決方案實現(xiàn)復雜問題,多模態(tài)數(shù)據(jù)跨層根因分析,縮小問題定界范圍,快速提升解決問題效率。
在探討智能運維解決方案與AI大模型結(jié)合升級的發(fā)展趨勢上,何誠總分析了大語言模型在AIOps領域應用的三個變化階段,包括直接調(diào)用外部開放大模型,結(jié)合知識圖譜構(gòu)建本地行業(yè)大模型以及未來通過本地行業(yè)大模型構(gòu)建智能運維大腦。通過調(diào)研和分析,明確指出當前企業(yè)級大模型應用,應該以結(jié)合行業(yè)知識圖譜,構(gòu)建本地行業(yè)大模型(Foundation Model)為主要目標和方向,以此解決計算資源瓶頸、數(shù)據(jù)安全、缺乏領域知識產(chǎn)生幻覺等核心問題。
何誠總還介紹了鼎茂在智能運維領域AI大模型方向探索的路徑和進展,主要涵蓋在支持結(jié)構(gòu)化數(shù)據(jù)多任務分析的時序大模型框架,支持非結(jié)構(gòu)化數(shù)據(jù)多任務分析以及知識圖譜增強的語言大模型框架,以及最終實現(xiàn)支持多模態(tài)復雜問題綜合分析的統(tǒng)一領域大模型框架。
何誠總最后表示,AI技術(shù)和應用域?qū)⒖焖侔l(fā)展,鼎茂也將始終在AI驅(qū)動的數(shù)智平臺的基礎上,構(gòu)建支持企業(yè)IT運維到業(yè)務決策端到端的智能化解決方案的智能運維大腦,協(xié)助更多企業(yè)客戶進行數(shù)字化和智能化變革。
百度文心大模型是國內(nèi)首屈一指的AI大模型,在各個產(chǎn)業(yè)的應用正不斷擴大和深化。百度智能云作為國內(nèi)引領AI技術(shù)發(fā)展的先鋒企業(yè),其AI大模型和解決方案在各個產(chǎn)業(yè)的應用中發(fā)揮著重要作用。
百度智能云私有云部高級產(chǎn)品經(jīng)理王發(fā),分享《AI原生思維下的大模型智能運維實踐和展望》。演講闡述了在前沿技術(shù)視角下,對于大模型和AIOps領域的探索和展望。
王發(fā)總首先強調(diào)了AI原生思維的重要性。隨著生成式AI技術(shù)的不斷發(fā)展,我們應改變傳統(tǒng)思維方式,以適應這個AI時代。AI原生應用是利用生成、推理、記憶等AI能力,并能自然地與其他系統(tǒng)進行交互。這不僅簡化了操作流程,而且還能提供更高效的工作方式。
百度在智能運維領域也做出了重大貢獻。自2000年以來,百度已經(jīng)經(jīng)歷了四個階段:人工運維時代、自動化運維時代、AIOps領域和利用大模型加持AIOps。在這個過程中,百度推出了一系列AIOps產(chǎn)品,如異常檢測、告警收斂和故障傳播圖等。但盡管現(xiàn)有的AIOps產(chǎn)品已經(jīng)做得很好,專家們?nèi)匀话l(fā)現(xiàn)了其局限性。
王發(fā)總提到,為了解決現(xiàn)有問題,專家們開始探索如何利用大模型加持AIOps。由于大模型具有出色的評價能力、復雜任務拆解和執(zhí)行能力以及出色的生成能力,它們可以更好地解決運維中的復雜問題。例如,大模型可以評價并優(yōu)化巡檢腳本;將復雜問題分解成更小的任務,以便更有效地執(zhí)行;以及通過文生文、文生圖和文生視頻等方式,快速解決問題。
王發(fā)總最后表示:隨著AI原生應用的發(fā)展,我們有理由相信,未來的智能運維將更加便捷、高效和智能化。通過很多領先公司的努力,我們期待看到更多創(chuàng)新和突破,以推動智能運維的發(fā)展。
AIOps技術(shù)和應用領域正在進入一個新的發(fā)展階段,其價值從傳統(tǒng)的運維管理走向全域智能。隨著AI技術(shù)的發(fā)展,結(jié)合當下AI大模型技術(shù)的新一代AIOps行業(yè)解決方案,正在成為許多行業(yè)未來的技術(shù)戰(zhàn)略。新一代的AIOps將以智能運維大腦的形態(tài)出現(xiàn),并為企業(yè)的發(fā)展提供深度服務。
鼎茂科技AIOps解決方案總監(jiān) 郭順友,分享《智能運維大腦的建設思路》。詳細介紹了如何構(gòu)建企業(yè)級的智能運維大腦,并分享了在多個行業(yè)的落地實踐。
他指出:智能運維大腦是以豐富的運維項目最佳實踐經(jīng)驗為基礎,結(jié)合強大的AI算法引擎作為核心能力,融入客戶真實運維場景,沉淀出的一套全域運維能力集合。
鼎茂根據(jù)落地實踐經(jīng)驗,將智能運維大腦的建設路徑歸集為四個階段:
1.多維多模態(tài)數(shù)據(jù)的精細化治理;
2.顛覆傳統(tǒng)運維模式,基于指標中心進行統(tǒng)一運維對象模型建設;
3.基于AI引擎閉環(huán)賦能智能化運維場景;
4.實現(xiàn)智能運維大腦上層的故障檢測、故障分析、故障處置、資源優(yōu)化、知識圖譜等智能化場景建設。
通過智能運維大腦的建設,助力用戶從傳統(tǒng)運維到一體化智能運維發(fā)展方向的進階,全面提升企業(yè)運維效能和數(shù)智化運營能力。實現(xiàn)問題的高準確性發(fā)現(xiàn)和風險隱患的提前感知、高效的故障檢測和分析診斷能力、全域閉環(huán)AI算法引擎覆蓋,以及精細化的數(shù)據(jù)價值體現(xiàn),最終實現(xiàn)運維效率可達到1分鐘發(fā)現(xiàn)、5分鐘診斷、10分鐘處置。
基于對行業(yè)的深刻洞察,建信金科的DAK運維理念-運維數(shù)字能力、算法能力、運維知識體系,也被包括建行在內(nèi)的眾多大型金融機構(gòu)采納為智能運維體系建設的關(guān)注要素。
建信金科智能云解決方案專家趙崢,分享《基于DAK的智能運維探索與實踐》。
本次分享中,趙崢總介紹了在技術(shù)趨勢、信創(chuàng)監(jiān)管、業(yè)務發(fā)展三方面需求的驅(qū)動下,金融行業(yè)運維數(shù)字化轉(zhuǎn)型面臨著環(huán)境多、數(shù)據(jù)多、要求高的巨大挑戰(zhàn),同時為大家明晰了DAK運維數(shù)字能力、算法能力、運維知識體系的三大建設思路,分享了通過“平臺化+場景+知識”模式搭建全棧式智能運維工具產(chǎn)品的經(jīng)驗。
他指出,在企業(yè)智能運維體系架構(gòu)中,知識、AI和數(shù)據(jù)三個平臺構(gòu)成了運維大腦的核心。在知識內(nèi)容生命周期中的知識收集、知識管理、知識挖掘、知識應用四個領域,自動化與人工智能技術(shù)的快速發(fā)展,大量抽象而復雜的知識場景,可以不再依賴人力,通過信息技術(shù)的融合能夠形成巨大的知識賦能,構(gòu)建知識生產(chǎn)力的第二載體。
最后趙崢總總結(jié):向研發(fā)和業(yè)務交付價值、重視數(shù)據(jù)和知識、建立智能化思維,將作為智能運維實踐的重中之重。
AI大模型從誕生以來就伴隨著隱私性、安全性的討論。從數(shù)據(jù)隱私、模型訓練過程的商業(yè)機密泄露、大模型公平性要求的監(jiān)管審查,以及對抗攻擊等等層面,都受到關(guān)注。
上海人工智能研究院總工程師,王資凱,分享《合規(guī)條件下的生成式人工智能落地》。
王資凱總結(jié)合目前的實際生產(chǎn)現(xiàn)狀:訓練大的模型需要大量的高質(zhì)量訓練數(shù)據(jù);龐大的算力需求直接提升了驚人的成本;模型效果的保障需要在算法模型的細節(jié)不斷地嘗試和優(yōu)化;推理速度是限制大模型落地應用的重要瓶頸;黑盒體質(zhì)導致滿足不了垂直領域所要求的安全性和可解釋性……
針對這些現(xiàn)狀,他對AIGC的發(fā)展可能提出了一些預見性的想法:構(gòu)造高質(zhì)量的領域/產(chǎn)業(yè)數(shù)據(jù)集?圍繞場景推出小模型?推出“模型既服務”模式?針對細分領域/產(chǎn)業(yè)的推理設施?針對細分行業(yè)的模型測試集?圍繞細分內(nèi)容做可控生成和檢索增強?
全面就AIGC的缺陷、監(jiān)管、影響和落地幾個方面,系統(tǒng)性闡述了如何在道德和倫理規(guī)范的前提下,滿足合規(guī)條件,將生成式AI技術(shù)應用于實際場景中的前景和可能性。
智能運維領域幾年前就吸引了資本的關(guān)注,隨著技術(shù)的不斷進步和應用場景的擴大,智能運維領域也在持續(xù)演進和創(chuàng)新,資本也在重新觀測行業(yè)的趨勢和未來。
國方創(chuàng)新投資總監(jiān),張治,分享《資本視角下智能運維領域的前景》。
他指出數(shù)字化轉(zhuǎn)型進入深水區(qū),云化、云原生化的趨勢不可逆,再疊加上信創(chuàng)的推動,客戶的IT復雜度在急劇提升,這帶動了IT運維逐漸從人工運維往自動化運維方向發(fā)展,在此背景下以IT運維管理軟件與分析軟件為代表的IT運維產(chǎn)品在市場規(guī)模也在快速提升。
通過與成熟海外市場的發(fā)展對比,他還為智能運維行業(yè)的賽道者指出:因為中國的現(xiàn)實情況,現(xiàn)階段智能運維企業(yè)的核心競爭力在于從服務高IT水平客戶中產(chǎn)品、技術(shù)與場景的打磨,這會有一個共建的過程。這兩年我們也看到部分頭部玩家已經(jīng)完成最佳實踐方案打磨,下一階段,智能運維企業(yè)需要尋找高質(zhì)量發(fā)展的路徑,從與客戶共建進入到建議客戶,引領客戶的過程。
會議最后,來自用戶側(cè)和同業(yè)側(cè)的業(yè)內(nèi)人士也就大模型在領域內(nèi)的應用難點和價值量化向與會專家進行了互動探討。
值得期待的是,智能化從技術(shù)到產(chǎn)業(yè)落地正在加速。對IT和業(yè)務決策的影響價值來看,也已經(jīng)從代碼生成、效率工具升級發(fā)展到多環(huán)節(jié)、多領域的賦能。同樣值得期待和關(guān)注的是,在to B智能運維領域,AIGC的產(chǎn)品化時代。
相關(guān)稿件