數(shù)據(jù)庫是數(shù)字經(jīng)濟的基礎(chǔ)設(shè)施,是IT產(chǎn)業(yè)基礎(chǔ)軟件三駕馬車之一。當(dāng)今世界,數(shù)字化建設(shè)與數(shù)據(jù)智能發(fā)展如火如荼,數(shù)據(jù)庫的穩(wěn)定與高效是保障高科技產(chǎn)業(yè)順利發(fā)展的重要因素,數(shù)據(jù)庫相關(guān)技術(shù)也成為新時代背景下大國之間競爭的制高點。目前,數(shù)據(jù)庫管理系統(tǒng)是美國對華禁運的35項“卡脖子”技術(shù)之一,而保障數(shù)據(jù)庫穩(wěn)定運行的智能運維技術(shù)是數(shù)據(jù)庫技術(shù)皇冠上的明珠。傳統(tǒng)人工運維方式已經(jīng)越來越難以維護功能復(fù)雜的數(shù)據(jù)庫系統(tǒng)在龐大業(yè)務(wù)與復(fù)雜負(fù)載下的穩(wěn)定性與高效性。但隨著數(shù)據(jù)業(yè)務(wù)的上升,對數(shù)據(jù)庫運維的需求卻日漸高漲,如何解決其中的內(nèi)在矛盾,已成為學(xué)術(shù)界與工業(yè)界共同關(guān)心的議題。
人工運維存在下列問題:
·成本高:數(shù)據(jù)庫管理員(DBA)年薪普遍在50萬以上
·效率低:資深工程師進行一次維護調(diào)參需要6小時以上
·門檻高:DBA培養(yǎng)周期長,非資深DBA調(diào)參效果難以滿足需求
解決方案
針對上述問題,SmartOp團隊提出SmartOp數(shù)據(jù)庫智能管家,運用人工智能技術(shù)對數(shù)據(jù)庫進行智能調(diào)參和索引推薦,大大提高數(shù)據(jù)庫性能。團隊的技術(shù)方案目前達(dá)到國際領(lǐng)先水平,是唯一可落地的商業(yè)化解決方案。本項目主要功能分為兩部分:
① 數(shù)據(jù)庫自動調(diào)參
依托機器學(xué)習(xí)技術(shù)高效完成數(shù)據(jù)庫參數(shù)調(diào)優(yōu),降低現(xiàn)階段數(shù)據(jù)庫參數(shù)調(diào)優(yōu)人力和時間成本。該功能使用長短期融合獎勵函數(shù),在綜合考慮吞吐量和延遲的基礎(chǔ)上,結(jié)合短期收益和長期收益對調(diào)參過程進行彈性控制,解決了智能調(diào)參不能很好適應(yīng)負(fù)載動態(tài)變化和工作狀態(tài)動態(tài)變化的難題;開發(fā)在線訓(xùn)練方式,利用后臺克隆和并行化技術(shù)同時試錯多種調(diào)參方向,輔以機器學(xué)習(xí)技術(shù)對數(shù)據(jù)庫參數(shù)個數(shù)和維度進行壓縮降低調(diào)優(yōu)成本,解決了自動調(diào)參中參數(shù)數(shù)量多、相關(guān)性復(fù)雜、空間大等難題。
② 數(shù)據(jù)庫智能索引推薦
針對數(shù)據(jù)庫中因索引不合理導(dǎo)致的慢請求,以智能化方式推薦合理的索引結(jié)構(gòu),提高云服務(wù)廠商的服務(wù)質(zhì)量和數(shù)據(jù)庫購買用戶的使用體驗。該功能使用端到端訓(xùn)練技術(shù),以向量化方式統(tǒng)一管理工作負(fù)載和索引,杜絕人為干預(yù),真正做到端到端訓(xùn)練;使用代價估計模型,利用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進行代價估計,快速評估索引性能,提升學(xué)習(xí)索引推薦效率。
圖1 數(shù)據(jù)庫自動調(diào)參
圖2 數(shù)據(jù)庫智能索引推薦
性能指標(biāo)
①數(shù)據(jù)庫自動調(diào)參
運維手段 |
吞吐量 |
延遲 |
調(diào)優(yōu)時間 |
SmartOp |
7K TPS |
72ms |
2h |
人工運維 |
6.1K TPS |
85ms |
6h |
OtterTune卡內(nèi)基梅隆大學(xué) |
6.2K TPS |
90ms |
61h |
BestConfig中科院 |
6K TPS |
94ms |
52h |
·調(diào)參效果在業(yè)內(nèi)首次超過具有12年經(jīng)驗的數(shù)據(jù)庫管理員手工調(diào)參
②數(shù)據(jù)庫智能索引推薦
普通DBA推薦一次索引需要1-2小時,二智能索引推薦只需要1-3分鐘。同時,智能推薦的索引相比DBA推薦的索引可以使數(shù)據(jù)庫相應(yīng)時間降低34%,空間消耗減少25%。
研發(fā)階段
①SmartOp 相比于市面上的其他技術(shù)和產(chǎn)品,真正解決了自動調(diào)參實際落地的難點問題,性能調(diào)優(yōu)結(jié)果首次全面超越DBA專家,大幅提高數(shù)據(jù)庫運維效率。基于多種不同負(fù)載和不同類型數(shù)據(jù)庫的大量實驗證明,自動調(diào)參系統(tǒng)性能優(yōu)化結(jié)果明顯優(yōu)于目前已有數(shù)據(jù)庫調(diào)優(yōu)工具和 DBA 專家。即使在彈性云環(huán)境下,即用戶購買數(shù)據(jù)庫內(nèi)存或磁盤大小發(fā)生變化,或負(fù)載發(fā)生變化(類型不變) 的情況下,實驗證明自動調(diào)優(yōu)系統(tǒng)依然保持了較好的適應(yīng)能力。
②調(diào)優(yōu)時間和調(diào)優(yōu)結(jié)果可控,極大縮短調(diào)優(yōu)時間并能夠保證數(shù)據(jù)庫性能的提升,相比于國際領(lǐng)先的技術(shù) 0tterTune,SmartOp 的性能要高出 20%。
掃碼關(guān)注,查看更多科技成果