數據庫作爲IT基礎設施的底座,正搭乘雲時代的列車不斷前進。上雲成爲非常明確的數據庫發展趨勢,根據IDC《2024年下半年中國關係型數據庫軟件市場跟蹤報告》顯示,2024年中國公有云關係型數據庫規模8.7億美元,同比增長48.7%。
在雲原生時代,客戶需要什麼樣的數據庫?數據庫會如何演進?矩陣起源GlobalCTO田豐就相關問題展開了分享,他認爲,雲原生時代,數據庫將向平臺化發展,MatrixOne所代表的超融合技術路線將大有可爲。
長在雲上的超融合數據庫
數據成爲新的生產要素,挖掘數據價值助力企業經營決策成爲企業剛需。在雲原生時代,數據量爆炸式增長,需要更爲高效的數據處理能力,對數據庫提出了更高的要求。
田豐指出,隨着企業上雲不斷深入,最終大部分業務應用可能都會上雲,這些應用中存在大量的事務、分析、流處理等數據處理需求。此外,隨着更多的新應用出現,尤其是IoT領域的新應用不斷髮展,物聯網設備產生的數據呈爆發式增長。面對多樣化的數據處理需求,以及物聯網數據爆發帶來的新需求,企業需要增強數據處理能力,既可以通過部署多種數據中間件來拓展關係型數據庫的能力來解決,也可以選擇一箇超融合數據庫來解決。
“企業希望所有的數據在一箇統一的數據平臺裏進行統一管理,像是一箇數據操作系統,我們希望通過融合爲客戶複雜多樣的數據應用需求提供一種極簡的解決方案。”帶着以上這些思考,2024年成立的數據庫創業公司矩陣起源自研了MatrixOne超融合數據庫,並提出了HSTAP的超融合理念。
矩陣起源所提的HSTAP中的“S”指的是串聯AP和TP的Streaming能力,即在HTAP數據庫內部實現了數據庫內置流處理能力。通過一種創新的架構實踐極簡理念,把數據庫的複雜度留給產品的研發階段,而把簡單、易用、好用的最終體驗帶給用戶。
實際上,MatrixOne是一款雲原生、分佈式的超融合數據庫。今年,MatrixOne數據庫在工程方面取得了突破,最新版本MatrixOne0.6在產品層面已經基本具備超融合能力,團隊的設計理念在工程上基本實現,架構層面存儲計算分離、分佈式事務、資源隔離、分析查詢等數據庫基礎能力已經具備,MatrixOne進入到實際應用階段。
作爲一款雲原生數據庫,MatrixOne可以很好地運行在K8S上,是長在雲上的數據庫,支持將數據持久化到共享存儲,兼容不同的協議,如S3,HDFS,Ceph等。無論使用公有云、私有云還是混合雲,都可以接入合適的共享存儲。MatrixOne抽象出了一層FileService,它爲上層提供一箇統一的接口來訪問這些多樣化的存儲資源,對調用方屏蔽了不同存儲的差異和複雜性。MatrixOne可以根據雲上不同的硬件能力進行編排,充分利用雲的特性以獲取更優的性能和性價比。
在架構實現上,MatrixOne採用存算分離架構並做了比較徹底的解耦,存儲層、數據層、計算層分離,使得MatrixOne在遇到系統資源瓶頸時,能夠靈活實現節點的擴容。同時,多節點的架構下,資源可以更高效分配,一定程度上避免了熱點與資源爭用。
作爲一款融合型數據庫,資源隔離的挑戰非常大,是架構設計的重點和難點。目前,無論是TP與TP,AP與AP,TP與AP,MatrixOne都實現了很好的隔離,最小化不同負載之間的干擾,獲得更好的性能。如,其分佈式事務採用了樂觀事務與快照隔離,快照隔離級別比常見的ReadCommitted讀已提交更加嚴格,既可以有效防止髒讀,又能夠更好地適配分佈式樂觀事務。AP和TP不同的負載在不同物理節點運行,避免相互干擾,保證事務層級的正確性。
“我們希望最終能夠爲客戶創造價值,從這個角度來講,MatrixOne會往更高效、更一致的集成、更簡化的管理,以及數據治理方面發展,爲客戶提供一箇更好的性價比。”田豐強調,MatrixOne相比其它超融合數據庫,從第一天就更注重數據庫的自我管理、自適應、自調優,而且從頭開始研發沒有歷史包袱,進展會更快一些。
未來數據庫的演進方向
隨着MatrixOne在工程方面不斷進步,MatrixOne團隊對數據庫架構路線的發展越來越清晰。田豐指出,云爲異構硬件帶來很大的自由度,不論私有云、公有云還是混合雲,會有各種不同功能的新硬件出現,比如CXL大內存系統,MatrixOne會與相關廠商合作,利用新硬件的特性實現數據庫更好的功能、性能,達到更好的性價比。此外,在利用對象存儲等雲平臺能力方面,MatrixOne也會加大投入以更好發揮雲的優勢。
長遠來看,客戶對分佈式數據庫的靈活部署、動態擴展規模以及性價比都會有越來越高的需求。從應用上來講,分佈式數據庫會越來越重要。MatrixOne會不斷加強其分佈式能力,降低運維複雜度。
Serverless是數據庫技術發展的熱門話題,被認爲是雲原生數據庫的下一站,所謂Serverless並不是沒有服務器,而是服務器無感知。田豐強調,MatrixOne本身是雲原生數據庫,但是也支持Serverless化,可以根據客戶需求按需部署。他指出,Serverless解決的實際是管理問題,對用戶屏蔽掉了硬件管理的細節。Serverless數據庫應該具有以下幾個特徵:
一是,Serverless數據庫不再綁定硬件,不論虛擬機還是物理機,都不再綁定機器,可以實現動態擴縮容。二是,Serverless強調計算存儲分離。三是,Serverless要有比較好的容錯設計,當Server崩潰掉或者從一箇地方挪到另一箇地方,整個過程能夠平滑遷移。
未來,MatrixOne會繼續打磨產品,提高產品的性能和穩定性,爲客戶提供真實的價值。“不管我們內部怎麼做,最終結果一定要簡化用戶(DBA、開發者)的工作,對用戶來講,他們是看到一箇更簡單的數據平臺,我們把複雜度儘量內部消化。”田豐認爲,客戶應用的複雜度主要有兩種,一種是業務邏輯自身比較複雜,另一種並不是業務邏輯本身產生,而是使用的平臺工具帶來的複雜度。MatrixOne希望把第二類非業務上的複雜度降到最低,給客戶提供一箇簡單、易用、高效的數據庫,讓用戶把更多精力放到業務應用上。
把複雜留給產品,把簡單、易用留給客戶,這應該是所有數據庫廠商的願景,新的數據庫架構將會爲這個市場帶來哪些驚喜,還需要在更多真實場景中試煉。目前,已經有很多工業、能源等海內外企業向MatrixOne提出了明確的需求,接下來MatrixOne會與客戶一同成長,一起打磨產品。我們期待明年MatrixOne1.0版本正式發佈,MatrixOne能夠取得更大的突破。