5月19日-23日,國際頂級數(shù)據(jù)庫學(xué)術(shù)會議ICDE 2025(第41屆IEEE國際數(shù)據(jù)工程大會)于中國香港舉辦。本屆會議中國高校和企業(yè)表現(xiàn)亮眼,其中數(shù)據(jù)庫廠商OceanBase共有6篇論文入選,有1篇獲“最佳工業(yè)和應(yīng)用論文亞軍”,研究方向包括分布式數(shù)據(jù)庫、聯(lián)邦學(xué)習(xí)、隱私保護等,展現(xiàn)了其在數(shù)據(jù)庫與AI融合上的突破進展。
ICDE與SIGMOD、VLDB并稱為數(shù)據(jù)庫領(lǐng)域三大頂級會議,是中國計算機學(xué)會CCF推薦的A類國際學(xué)術(shù)會議,在全球?qū)W術(shù)圈中擁有極高的權(quán)威性和影響力。本屆會議吸引近千名全球頂尖學(xué)者及行業(yè)專家參與,聚焦數(shù)據(jù)工程領(lǐng)域的前沿技術(shù)突破與行業(yè)應(yīng)用實踐。
伴隨AI技術(shù)的爆發(fā)式發(fā)展,數(shù)據(jù)庫作為數(shù)據(jù)存儲和管理的核心系統(tǒng),面臨海量數(shù)據(jù)存儲、復(fù)雜計算需求、隱私保護等多重挑戰(zhàn)。以O(shè)ceanBase為代表的數(shù)據(jù)庫廠商正在創(chuàng)新探索數(shù)據(jù)庫與AI的融合,建造AI時代數(shù)據(jù)底座。
被評定為“最佳工業(yè)和應(yīng)用論文亞軍”的《OceanBase單元化:構(gòu)建下一代在線地圖應(yīng)用》,介紹了OceanBase的單元化架構(gòu)設(shè)計。該架構(gòu)將系統(tǒng)服務(wù)拆分為多個獨立“單元”,每個單元可在單臺服務(wù)器獨立部署并支持跨區(qū)域多機協(xié)同,結(jié)合讀寫分離和混合架構(gòu),系統(tǒng)自動平衡事務(wù)型(OLTP)和分析型(OLAP)負載,實現(xiàn)高可用、彈性擴展、資源隔離和高性能,高效處理大規(guī)模數(shù)據(jù)和高并發(fā)訪問。該架構(gòu)已在高德地圖落地實踐,展現(xiàn)增強的容災(zāi)能力,并在寫密集型和讀密集型基準測試中均實現(xiàn)性能提升。
在AI重塑數(shù)據(jù)處理需求的背景下,OceanBase多項研究聚焦數(shù)據(jù)庫與AI融合,探索智能化數(shù)據(jù)處理路徑。
例如,針對縱向聯(lián)邦學(xué)習(xí)中參與方選擇效率低、數(shù)據(jù)多樣性不足的痛點,《追蹤數(shù)據(jù)多樣性:縱向聯(lián)邦學(xué)習(xí)中的參與者選擇》一文提出VFPS-SM優(yōu)化框架。該框架將參與方選擇轉(zhuǎn)化為“子模函數(shù)最大化”數(shù)學(xué)問題,結(jié)合KNN算法、top-k查詢與加密技術(shù),在保護數(shù)據(jù)隱私的前提下,使參與方選擇效率最高提升365倍、模型訓(xùn)練效率提升35倍。這一技術(shù)可應(yīng)用于醫(yī)療、物流、交通等領(lǐng)域,助力跨機構(gòu)數(shù)據(jù)協(xié)作建模,例如加速多醫(yī)院聯(lián)合疾病預(yù)測模型的開發(fā)。
另一篇論文《如何響應(yīng)安全且私密的SQL查詢》聚焦數(shù)據(jù)安全與訪問效率、查詢精度的平衡。文章綜述現(xiàn)有安全隱私SQL查詢的算法,總結(jié)了一套通過模塊化拆解復(fù)雜SQL查詢的方法,結(jié)合安全計算與差分隱私技術(shù),在保證數(shù)據(jù)安全、用戶隱私的情況下,提高SQL查詢的效率和精度。
在ICDE 2025上,OceanBase還受邀舉辦一場題為“AI時代的數(shù)據(jù)庫”的研討會,多位數(shù)據(jù)庫與AI領(lǐng)域的資深學(xué)者和研究員參會發(fā)言,分享Data x AI領(lǐng)域最前沿的學(xué)術(shù)進展與創(chuàng)新實踐。
AI技術(shù)的引入,正逐步將數(shù)據(jù)庫推向全新時代。作為根自研的原生分布式數(shù)據(jù)庫,OceanBase自2010年創(chuàng)立以來,始終堅持技術(shù)創(chuàng)新,多次在SIGMOD、VLDB、ICDE、AAAI等國際學(xué)術(shù)舞臺展示硬實力,并與華東師范大學(xué)、中國人民大學(xué)、武漢大學(xué)、新加坡南洋理工大學(xué)等機構(gòu)合作,共同探索數(shù)據(jù)庫前沿技術(shù)。2025年4月,OceanBase CEO楊冰宣布公司全面進入AI時代,提出“Data x AI”戰(zhàn)略,啟動人才和組織體系升級,建設(shè)AI時代的數(shù)據(jù)底座。
校對 盧茜