技术带来美好,在这个“卡脖子”领域,中国科学家成功破局——

全世界通用的数据库共5个。
4个在美国,1个在欧洲,后也被美国公司收购。这是美国技术长期占绝对主导的一个领域。
和近年芯片被广为人知相比,数据库对大众来说略显生疏和神秘。如何理解它的重要性?数据库、操作系统和芯片,并称现代信息技术领域三大核心基础。其中,数据库作为存储、处理、分析数据的关键技术,被誉为数字经济的底座。
在我国,数据库是“核高基”重大专项重点突破的核心基础软件,属于“卡脖子”的关键基础软件赛道。
这个赛道上,自上世纪八九十年代欧美几个大型数据库出现后,由于竞争门槛太高,世界上就再无同级别新数据库面世。结果是,我国数据库市场长期被国外厂商垄断。
随着互联网爆发带来海量数据,如何处理数据,不仅是行业难题,也事关国家信息安全。国家对这一领域也曾进行大量投入,只是尚未结出硕果。
面对这个中国人有些熟悉的剧本,现实主义的选择,或是视而不见,或是胆怯不碰,或是继续拿来主义,抑或机会主义,浅尝则止,不行就撤。
然而,有个20几岁便已功成名就的科学家,放弃了令人艳羡的职位和优渥待遇,在外界普遍不看好的情形下逆风而行。13年来,一次次面对外界质疑和否定,带领团队自主研发了国内首个拥有100%自主知识产权的分布式数据库——OceanBase。
和目前通行的集中式数据库相比,分布式数据库算得上换道超车,兼备了集中式数据库无法同时具有的“记账”(OLTP)和“数据分析”(OLAP)两种功能。
眼下,OceanBase不但让孵化它的支付宝全面替换掉了原本依赖的国外数据库,而且开始对外输出,服务超过1000家客户,涵盖金融、政务、能源等诸多行业,并走出国门,让全世界拥有了第一个可以大规模应用在金融核心业务的中国数据库。

未上传,可自行百度哈哈

料图片:阳振坤(右二)和工程师们进行讨论。张朋红

到市场上,到需求中去
这个科学家的名字叫阳振坤,目前是蚂蚁集团副总裁,也是OceanBase的创始人、首席科学家。
上世纪90年代初,还只有20几岁的阳振坤就声名鹊起。1984年进入北京大学,一路获得数学学士、硕士以及计算机博士学位后留校,追随其导师——著名科学家王选院士,在激光照排系统研发中做出了重要贡献,获得1995年度国家科技进步一等奖(排名第四),相关成果转化成的商品,在海内外大量销售,取得了巨大的社会和经济效益。
凭借激光照排领域的贡献,阳振坤被破格晋升为教授,1999年成为北京大学首批“长江学者奖励计划”特聘教授之一。已获得世俗意义上的成功,让多数人一辈子都难以企及的阳振坤本可以“躺”在这份成果上,收获安稳和舒适。然而出人意料的是,36岁时他做了个有些“中年叛逆”的决定,辞去北大教职。
原因是,阳振坤觉得:“激光照排技术成熟后,就觉得自己这个年龄还能为社会做点事情。在学校里面可能就是上课、做研究写论文,一直熬到退休也是一条路,会很平稳。”导师王选的理念影响了他,做工程的需要到市场上,到需求中去,才能真正发挥价值。
阳振坤觉得自己在工程领域有些特长。眼看互联网行业的成熟和发展,他决定跳出舒适区,去企业找到一个新的能让自己对社会有用的方向。
在市场中找到数据库这个新的攻关方向,阳振坤花了8年时间。2010年,阳振坤加入了阿里巴巴。彼时,中国的移动互联网开始爆发,带来了海量数据,传统集中式数据库在应对海量存储、高并发、容灾运维等方面显得不堪重负。关键的是,有人算了一笔账,对中国的电商行业来说,1万亿商品交易总额(GMV)意味着,每年要给IOE(IBM、Oracle、EMC)三家公司支付200亿元采购费。这笔钱会超过他们当年所能赚取的利润。
这让一直在寻找的阳振坤看到了机会。如果将数据库的处理能力和容量比为“马拉车”,随着数据增长,传统集中式数据库的解决方案是把“马”不断做大,但诞生于数十年前的集中式数据库很难应对这种指数级的增长,成本高昂。而且还有一个缺点,一台机器出问题,整个系统会崩溃。对分布式颇有研究的阳振坤意识到,用分布式来研发数据库,用许多“小马”来共同拉“大车”,不仅更灵活,可靠性高,而且成本也更低。
这便是中国人自主研发原生分布式数据库的灵感来源。
非功利主义可以走得更远
有统计显示,每一项国家科技奖的背后,科学家平均要坐16年“冷板凳”。
科技进步行走在无人区,结果有很大不确定性,路径也并不清晰,要面对周边的质疑。科学家同样是有血有肉的人,有不得不低头的现实生活需要,能耐住寂寞,不焦虑,把“冷板凳”坐热的是少数。然而核心技术买不来,要突破,就少不了不浮不躁,心无旁骛的人。
OceaBase从立项之初,就时刻有夭折风险。“数据库巨头们试了很多次没做成的事,你们几个人能成?”“二三十年来一直没有新大型数据库出现,你们没想想为什么?”从内到外,质疑声不断。
数据库虽复杂,要做也不是没有捷径。海外数据库巨头已开源,国内厂商拿着开源穿马甲,改头换面成自己的来做,也是很多人的选择。但那样就掌握不了核心的东西,而且别人的版本升级你也得跟着升级,所以终究还是别人的附庸,自己的技术能力也没长起来。
缺人也是头疼的问题。本来数据库这行专业的人就少,国内更少。很多人不愿意做,因为领域比较成熟,发论文会难。海外数据库巨头的高管还曾公开扬言,绝不培养中国员工,不能任由中国像美国培养出越来越多的工程师。
公司则给出了两年的期限,两年内全力支持,如果两年做不出来,就关停。
就是在这样的情形下,没有任何先例可参考的阳振坤,带着拼凑起来的几十人的团队,一行一行代码开始了分布式数据库之路。这个团队除了阳振坤,剩下的基本都是应届生。
转眼到2012年底,两年之期到来,OceanBase的功能尚未完善,关停风险也随之而来。虽然最终公司并未这么做,但接下来几年,阳振坤和他的团队依旧在冷板凳上坐着,虽屡屡主动请缨,业务团队却依然不信任,不敢用。“万一出问题,怎么办?老的数据库至少稳健。”从业务角度出发,担心也不无道理,但这种不信任却让新产品陷入了死循环。
直到2014年“双11”前夕测试时,一直依赖的国外数据库崩了。技术团队在没有办法的情形下,不得不紧急启用OceanBase ,在冷板凳上坐久了的阳振坤,终于等来了证明自己的机会。
那年“双11”,一贯谦逊寡言的阳振坤难得说了一次“过头话”。面对CEO有没有信心的询问,站在窗边的阳振坤说:“出问题的话,我们准备从这跳下去。”
最终一切都很顺利。此后的时间里,OceanBase以远低于传统数据库的成本,扛住了支付宝一次又一次的“双11”交易峰值。2019年和2020年,在被誉为“数据库领域世界杯”的TPC-C和TPC-H基准测试中,两次封顶世界纪录,打破了由Oracle(甲骨文)保持了9年之久的世界纪录,成为唯一两次登顶该榜单的中国数据库产品。
在突飞猛进的时代,阳振坤和他的团队信奉另一种职业逻辑,静心专注于自己的代码,深耕技术也可以取胜。正如爱因斯坦在《探索的动机》中所说:“在攀登科学高峰中,功利主义也能走远,但非功利主义可以走得更远,能够跨越从0到1。”
阳振坤对自己的评价是:我不是一个很聪明的人,只是我把精力时间都集中在一个点上。
让中国数据库“顶天立地”
2022年11月,阳振坤获得中国计算机界的至高荣誉“王选奖”。但58岁的阳振坤更愿意称自己是“数字工匠”或者“程序员”。
导师王选多年前的一段教诲,是他做很多事的原则。王选说,做事情要顶天立地。顶天就是做的东西技术上要有过人之处,立地就是做东西的时候就得想着别人怎么来用它。否则,你技术再好再牛,不符合别人的需求,也没有用。
阳振坤在做国产数据库时,就要求必须“顶天立地”。在这个理念下,OceanBase 没有成为研究室里的花瓶,凭借高可用、高扩展、高兼容、高性价比及稳定安全等优势迅速走向了市场。
工信部赛迪顾问软件与信息服务产业研究中心发布的报告显示,OceanBase已占据国产分布式数据库金融市场占有率第一的位置。
OceanBase目前已助力1000多家行业客户实现数字化升级,涵盖金融、政务、能源、运营商、交通、互联网等海内外企业,有30%的客户将OceanBase应用于核心系统。国内70%千亿资产规模以上银行、75%头部证券机构、65%头部保险机构、45%头部基金公司都选择OceanBase进行核心系统升级。全国1/5省份的移动运营商、1/4省份的人社部门等都在采用OceanBase。
作为中国数据库的代表,OceanBase的出海脚步也在加快。截至目前已在美洲、欧洲、亚洲三大洲的30个可用区提供服务。非洲电子钱包Palmpay也在OceanBase助力下实现云迁移,降低了80%数据库成本。
阳振坤说,数据库没有国界,中国的数据库在全世界业务收入比例还很小,如果我们不能走出去,企业也没有活路。他还不敢说目前国产分布式数据库已完全成功,但他相信,一定能成。
“我们只是一个分布式数据库领域的‘破局者’,要在变局中开新局,还需要攻克很多难关。”年近六旬,他仍正在技术一线一个一个地攻关。排在日程上的一个难关是,如何将数据库出故障后恢复时间再缩短。前几年,阳振坤给OceanBase设计的算法,已经让恢复时间可以做到30秒,全球领先。不过他觉得还是长了些,用一年多时间,苦思冥想设计了新算法,希望能做到5秒,最后结果是8秒。

所以,还不能止步。


来源:   参考消息!!!

上一篇:绿智知识产权热点下一篇:大卢屯兄弟减震厂,常年招工中!!!附兄弟减震企业简介——绿智知识产权