·OceanBase 4.3推出列式存儲引擎,構建PB級實時分析數(shù)據庫,可實現(xiàn)秒級實時分析,進一步加強TP(事務處理)/AP(分析處理)一體化。
數(shù)據庫是基礎設施的基礎設施,是存放數(shù)據的倉庫。4月20日,在第二屆OceanBase開發(fā)者大會上,螞蟻集團原生分布式數(shù)據庫OceanBase 4.3發(fā)布。該版本推出列式存儲引擎,構建PB級實時分析數(shù)據庫,可實現(xiàn)秒級實時分析,進一步加強TP(事務處理)/AP(分析處理)一體化。
OceanBase首席科學家陽振坤表示,數(shù)據庫尤其是事務處理的數(shù)據庫需要大量業(yè)務長時間打磨才能做起來,但沒有多少業(yè)務愿意做數(shù)據庫的“小白鼠”,這使得數(shù)據庫的成長非常艱難。從上世紀80年代商業(yè)數(shù)據庫誕生到今天,主流數(shù)據庫仍是一個手都數(shù)得過來。
“上世紀80年代的商業(yè)數(shù)據庫和數(shù)據庫產業(yè)一起成長起來。到了上世紀90年代,一些人覺得商業(yè)數(shù)據庫太貴了,他們希望做一些大家都用得起的數(shù)據庫,所以就出現(xiàn)了兩個開源數(shù)據庫。這兩個開源數(shù)據庫在市場上經過長時間廣泛使用,從邊緣到中心成長起來。再之后,就沒有數(shù)據庫長出來了。”但陽振坤表示,互聯(lián)網帶來了挑戰(zhàn)也帶來了希望,“因為有新需求,有大量并發(fā),有海量數(shù)據,還有對數(shù)據庫性價比更高的要求。”
2022年發(fā)布的OceanBase 4.0是一款100%根自研數(shù)據庫,從技術上首次突破分布式數(shù)據庫的單機性能瓶頸,實現(xiàn)單機分布式一體化。目前在一體化上,OceanBase已實現(xiàn)單機分布式一體化、TP/AP一體化、云上云下一體化、多模一體化等,用一個數(shù)據庫滿足客戶80%的場景需求。
此前,面向企業(yè)在強OLTP(在線事務處理)場景中的AP需求,OceanBase構建了混合事務和實時分析處理(HTAP)能力,在OLTP基礎上提供復雜查詢優(yōu)化、秒級低時延響應、水平線性擴展(千/億級數(shù)據關聯(lián)查詢)能力,部分滿足了企業(yè)的AP場景需求。但隨著數(shù)字化發(fā)展,越來越多企業(yè)需要更強的數(shù)據實時分析能力,在分布式數(shù)據庫的架構中實現(xiàn)更強的AP性能成為新的探索命題。
OceanBase 4.3從AP存儲入手,推出列式存儲引擎,實現(xiàn)可行存、可行列混存和可列存的多種存儲方式,同時融入分布式TP核心能力小事務寫入技術,有效消除數(shù)據導入延遲,滿足更嚴苛的AP實時分析需求。同時推出基于Column數(shù)據格式描述的2.0向量化引擎和物化視圖,進一步提升深度AP場景下的性能表現(xiàn),可實現(xiàn)秒級實時分析,極大提升OLAP(在線分析處理)實時分析的能力。
目前,OceanBase已服務超過1000家行業(yè)客戶,其中30%將其應用于核心系統(tǒng)。例如海底撈將OceanBase應用于會員系統(tǒng),既做事務處理又進行實時分析,為每位會員推薦定制化內容,實時分析算力提升30%,數(shù)據庫成本下降35%,更從容應對節(jié)假日流量高峰。