作为支撑“双11”背后的自研数据库,诞生自2010年的OceanBase正在迎来一次关键的发展节点。
2020年,OceanBase成立公司、进行商业化探索,当年仅有18个客户。2023年末,OceanBase公布其最新商业化进展:服务超过1000家行业客户,客户数年增长150%,其中30%客户将其应用于核心系统。
3月19日,蚂蚁集团官宣,旗下蚂蚁国际、OceanBase和蚂蚁数科已成立董事会,开始独立面向市场。
近日,OceanBase CEO杨冰与钛媒体App展开了一场独家对谈。
在对谈中,杨冰详解了OceanBase为更好地参与市场竞争所作出的组织阵型调整——成立金融&政企事业部,集中优势进一步支持好专有云客户;成立公有云事业部,加大公共云投入,力求在某些具体方向上打出1-2个规模化复制效应;成立国际业务部,探索海外拓展,将外派国内员工与海外本地招的员工合并,成立新的海外团队。
在发展路线上,杨冰十分强调“根自研”的价值。自研意味着必须要经历漫长的发展周期,从0到1自研三百万行代码的持续投入,到开源生态和人才生态的长期培育,再到技术的产品化和商业化的艰巨挑战,每一步都是穿越无人区的挑战,也是修炼自己和构筑壁垒的过程。杨冰向钛媒体App表示,“即便如此,我们对根自研这一大的技术方向非常笃定,而且面向现代应用架构的全新挑战,我们也没更好的选择。”
谈架构调整:金融政企是基本盘,投入新增长点
钛媒体App:独立运营,对于OceanBase来说意味着什么?
杨冰:独立运营是OceanBase的二次加速,在这之前我们从0到1,未来我们要从1到N,接受市场更强的考验,实现更高的增长速度。
打个比方,OceanBase是一辆赛车,已经完成了内圈比赛,跑到了外圈,只有在外圈这个高速赛道中跑到前几名才能成为F1。
钛媒体App:此次独立面向市场,产品或组织架构做出了怎样的调整?
杨冰:我们做了三个调整。首先,在我们已经具备经验和优势的金融、政企领域,将原本的运营商、金融等行业、及对应的交付团队合并成一个大事业部,集中优势资源进一步服务好专有云客户,最大化利用资源,让事业部的决策更加高效。
第二,我们战略投入公共云,探索OceanBase的第二增长曲线。把以公共云行业为主的团队合并,高效地完成在公共云领域的加速,也帮助某些可以形成规模化复制效应的团队快速拿到资源。
第三,我们外派国内有拓荒经验的业务同学,与海外本地团队合并,成立新的海外团队,加速复制国内经验,加速海外拓展进程。
总体来说,公共云和海外市场是我们新的增长点,而金融、政企仍是我们坚定的基本盘。对于分布式数据库而言,中国是最好的培育市场,有最大的海量数据场景,同时也面临大量核心系统数字化升级的契机,先把整个中国市场吃透,具备稳固的一席之地,这是将产品打磨成熟的最快路径,之后才有可能在世界的舞台上立足。
钛媒体App:OceanBase独立面向市场后,势必要开始追求更大的商业化和市场规模。在这种情况下,你认为未来的创新将会在哪些方面?
杨冰:创新主要集中在一体化方面。我们将继续践行“一体化”产品战略,对于具备一定复杂度和规模的系统,对系统的运维和管理人员来,all in one的统一技术栈将极大简化运维,也让系统架构更容易规划和统一,对应用开发人员来说,通过统一的编程界面或者一套SDK就能处理不同业务负载,也会极大提升开发效率,降低团队协同成本。无论是TP和AP的融合,还是NoSQL和其他数据类型的编程模型的融合,一体化的融合架构和编程界面是我们接下去的发力点。
此外,未来数字化世界的存储介质将趋于统一,我们的目标是在这个可预见的未来上构建一套一体化的解决方案,实现结构化与非结构化数据存储的统一,让OceanBase成为最适合现代应用架构的数据存储平台。
谈自研路线:因为笃定,因为别无选择
钛媒体App:选择自研技术路线的底气从哪里来的?
杨冰:我认为我们的底气在于两个方面。
首先,对技术方向的坚定信念是我们的底气。十年前,阿里蚂蚁遇到的双11难题,以原有的集中式数据库、开源技术都无法解决,或者说解决的代价巨大,我们趟出了自研数据库这一条成功的道路,也为解决当前市场所面临的数据库难题奠定基础、积累经验。我们坚信只有自研才能根本解决数据库应用到产业里的核心问题,这种信念也使我们敢于决策并承担解决问题的责任。
其次,是对场景应用的深刻理解。我们认为,技术和产品的最大挑战并非设计或论证的难度,而是是否有合适的场景进行打磨和验证。幸运的是,我们拥有自己的产品和业务场景,这为我们的技术开发提供了天然的试验场。这种独特的优势让我们有信心克服实际应用中的挑战。
钛媒体App:自研给你们带来了什么样的价值?
杨冰:有两年我的钉钉签名是“逢山开路遇水搭桥”,研发就是这么一个过程,OceanBase是从0到1做出来的,我们的人才储备、我们的工程体系也都是从0到1量身打造的,整个团队都积累了非常丰富的数据库领域的解构复杂问题的能力和很强的创新能力。
几百人协同开几百万行代码是一个非常复杂的的系统工程,期间会出现大量的bug,要能将这样的系统修正稳定,必须要在工程上需要有管控和收敛bug的能力。我们有一整套研发流程、测试体系、安全扫描体系来确保高效和高质量的迭代,我们也有内部实际应用的验证体系来确保生产级可靠。
其次是创新,我们能打破原有的架构设计,从根本上解决问题,包括我们的LSM-Tree高压缩存储引擎、在Paxos实现2F1A做到真正三副本、单机分布式一体化等都是基于自研带来的突破,这些创新其实很难以过去数据库的经典架构上实现,都只能推翻重来。但只有这样才能以第一性原理的原则去重新设计产品,才能打破常规创造更大价值。
谈开源与闭源:很多人对开源有误解
钛媒体App:关于数据库开源与闭源路线的差异,如何看待这个差异,如何在借鉴与创新之间找到平衡?
杨冰:我认为很多人并不完全理解什么是真正的开源。基于开源但不回馈社区的做法,或者是改完的部分又不开源,我认为不能称为开源。这种做法实际上可能更接近闭源,修改后的产品是一个黑盒。真正的开源,应该是持续贡献回社区的。不仅是使用开源技术,还要将自己的改进贡献回社区,这才是对开源精神的真正理解和支持。
基于开源修改的产品还有一个挑战就是对未来代码分支的掌控力或者话语权,这需要巨大的投入和社区的影响力,即便是这样也会存在很多非技术因素导致的分歧。所以,往往基于开源修改的产品都会进入一个比较纠结的境地,往左走改动比较深,可能会遇到因为话语权不够无法把改动回馈到上游,导致自己的版本变成孤版的问题。往右走改动的浅一些,虽然是能享受社区迭代发展的红利,但却没法构筑太深的竞争力,无法回答哪些能力是人无我有的问题。前者会走向另一种“自研”,后者则会变成一个没有差异化的“套壳”。
OceanBase是一个自研的数据库,并且采用了opencore的开源模式。我们开源了核心的300万行代码并与商业版内核采用同一个分支,并持续保持更新。我们享受了没有历史代码包袱和设计约束的好处,也需要承受从0-1培育生态的时间代价。这其实是一种选择,而不是一种平衡。不同的路径,短期内也许会并行、会交汇、会很相似,但从终点看是不同的。放到世界的历史舞台上,自研是一条大开大合、需要巨大投入但却能走的更宽的一条厚积薄发之路。
谈金融数据库:需求集中在兼容性、分布式系统成熟度以及生态适配
钛媒体App:请谈谈金融机构在数据库选型过程中考虑的各方面因素。他们的需求有何变化,以及不同规模机构之间需求的差异?
杨冰:在金融行业,大型机构、中小型机构的需求、关注点是不太一样的。
大型机构基础设施比较好,关注点不仅是分布式,还要有完整的单元化分布式解决方案和在分布式架构下如何建立高可用的技术风险体系。此外,由于系统多、数据量大、基础设施多样且复杂,大型机构也关注整套方案的安全性和改造成本,也要求数据库有更高的兼容性。
中小型金融机构,更倾向于一站式、一体化的解决方案,需要数据库的分布式能力,但在使用上不希望有所感知。重视兼容性和现有问题的快速解决,需要的不仅仅是技术产品,还包括对服务能力和生态系统的要求,尤其是在本地服务支持方面。
钛媒体App:金融机构在数据库迭代升级的进程中有什么新的发展?当前有什么新的趋势?
杨冰:金融机构的需求依旧集中在兼容性、分布式系统的成熟度以及生态适配方面。此外,对国产芯片的支持和适配度也是关注的焦点。总的来说,金融机构在数据库选型和升级过程中,无论是大型还是中小型机构,都在寻求技术上的成熟、服务能力的强大以及生态系统的支持。
谈市场竞争:免费才是最贵的
钛媒体App:如何看待数据库市场的价格战?
杨冰: 在一个时期内,数据库的市场竞争非常激烈,有时候会有价格战的现象。一些大厂商或者云厂商,可能会打出“羊毛出在猪身上”的价格战,数据库软件不要钱,但是在别的部分付费。现在市场已经更为理智,这种免费或低价的现象已经减少。
价格的竞争是一个正常的现象,但一家以数据库为唯一核心产品的公司和数据库只是其中一款非常重要产品的公司,在长期的价格策略上一定是有本质区别的。这是一种选择,当然我认为价格也是这个产品在企业中战略地位的体现和长期可持续发展的基础。另外,一家以产品为核心的公司和以整体解决方案和项目为核心的公司在定价上也会有巨大的差别,最终也会影响产品本身的可持续发展。
对OceanBase来说,我们始终专注于通过技术和服务的实力来赢得客户。事实上,客户也明白,没有免费的东西,免费才是最贵的。只要是企业的核心数据库、负载关键业务的数据库,贵和免费,都不是最重要的。
谈AI的冲击:AI会先冲击应用层
钛媒体App:AI会给数据库带来特别大的冲击吗?会让你们去重构架构吗?
杨冰: AI对数据库的冲击是间接的,AI会先对应用层产生冲击,应用形态的变化才会影响数据库。
过去十年,互联网的快速发展推动了对敏捷性、服务化以及云计算的追求。这些需求促进了特定应用形态和开发模式的演进,进而对分布式系统架构产生了根本性的推动作用。结果是,分布式数据库得到广泛发展,并且我相信,未来几年分布式数据库将成为主流。
那么,AI原生应用将呈现何种形态呢?在大家的想象中,它可能类似于过去的搜索引擎入口,比如百度搜索框或Google,也有可能演变为一个对话框,成为大多数应用的终极形态。现在AI的发展日新月异,还没有形成一个或者几个Pattern,所以对数据存储软件的需求到底会产生什么冲击还没法看的很清晰,但对几个趋势我自己是比较笃定的:
1. 由于对算力的依赖,AI as Service 是一个必然的形态,所以云原生会是持续繁荣、深化的趋势;
2. 非结构化数据(现代应用中以视频、图片、音频为主)是一种更加直白描述或者是复刻现实世界的数据形态,随着AI对非结构化数据的结构、理解能力和准确度有了质的飞跃,未来所谓 AI Native 的应用对结构化和非结构化数据的融合处理会是常态;
3. 随着分布式技术的成熟,目前的存储对“事实”类数据的存储和处理已经没有大的瓶颈,但对不同数据的二次分析加工,甚至是决策推理会产生更大的需求,而且在数据量、时效性、准确性、智能化等方面的需求会越来越高;
4. 随着分布式技术的瓶颈突破和普及,未来分布式数据库的底座会像对象存储/S3一样逐步普及和标准化,在应用开发中,各种数据结构在一套存储上的支持变得可能,应用开发时的灵活运用也会变得更加容易。开发者不再需要考虑工程上各种复杂问题,包括但不限于运维复杂度、可靠性的要求、扩展上的瓶颈、存储的成本、对事务和一致性的要求等等。
我们也对未来 AI Native的世界充满期待,也正在为更好的满足这些方向的需求而不断突破创新,期待能赶上时代的大势,成为现代应用架构的最佳数据处理平台。(本文首发于钛媒体APP,作者|蔡鹏程、秦聪慧,编辑|刘洋雪)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
这就是养大了孩子开始走向社会了
有目共睹啊
发展的真快啊,有3年前的18个客户到一千多
蚂蚁集团宣布蚂蚁国际、数科开始独立面向市场
公司都是这样的,领着走一段,放手去搏吧