题记这是关于数据库一体机的系列文章。上一篇《从Teradata到Exadata和zData的容量愿景》以及 Teradata和Hana的8年诉讼。很多文献也将Teradata视为第一个成功的商业数据库机创造者但这一说法其实并不完全准确。在数据库机的历史上还有一家名噪一时的公司——布里顿-李Britton-Lee。Britton-Lee是世界上第一台大规模量产的商业数据库机的构建者其一时之兴衰更能说明数据库机的过往与未来。图1 大卫·布里顿Britton-Lee与Teradata同年1979年创立其公司名称来自两位联合创始人——大卫·布里顿David L. Britton见图1和杰弗里·李Geoffrey M. Lee。可以说Britton-Lee与Teradata共同开创了计算机领域“数据库机Database Machine”这一新品类。为什么有Britton-Lee这样的创业机遇呢原因有两个。第一个起因是Britton和Lee曾经在生产磁带、磁盘的硅谷传奇公司Memorex1任职他们对存储设备有着深刻的理解。大卫·布里顿还曾担任国际存储器公司International Memories总裁他于1978年离职寻求创业。第二个起因是当时的硬件资源较弱新生的关系型数据库性能存在很大的问题并且关系型数据库最初被认为最适合数据分析场景。Britton和Lee创业的起点与Oracle非常相似。有一次一家计算机公司需要磁带支持但该公司不知道如何实现磁带驱动器软件于是要求Britton和Lee在约三个月内开发一款PC磁带站软件。他们及时地完成了该项目获得了约一百万美元的高额报酬并决定用这笔钱开设Britton-Lee公司。Oracle的起点类似拉里·埃里森Larry Ellison就职的精密仪器公司PIC希望推出一种取代缩微胶卷及其读取器的产品PIC以40万美元将软件开发项目外包给埃里森、鲍勃·迈纳Bob Miner和爱德华·奥茨Edward Oates。他们三人为此设立了SDL软件开发实验室公司这家公司后来发展成为了Oracle。此外大卫·布里顿和拉里·埃里森都曾经在Ampex公司任职。1Memorex美力思于1961年创立是硅谷早期的标志性企业之一。公司最初以生产高质量计算机磁带起家并迅速成为挑战IBM在大型机外设领域垄断地位的重要竞争者。其业务范围随后扩展至磁盘驱动器、通信设备及各类磁性存储介质在数据存储技术的黄金时代扮演了关键角色。对于全球大众消费者而言Memorex最辉煌的印记源于其20世纪70年代的经典营销活动——那句著名的广告语“是现场演出还是Memorex”Is it live, or is it Memorex?配合爵士天后艾拉·费兹洁拉Ella Fitzgerald极具穿透力的歌声与震撼的影像完美诠释了其高保真录音带的性能成为广告史上的传奇。Memorex于1981年被Burroughs公司收购后曾作为Unisys的一部分。上世纪90年代后品牌权先后流转于坦迪Tandy及Imation公司。尽管传统的磁带和磁盘制造业务已随技术更迭远去但Memorex至今仍是全球知名的消费电子品牌涵盖光存储、闪存及各类配件。图2 鲍勃·爱泼斯坦在创业的开端Britton和Lee还找到了精通数据库的鲍勃·爱泼斯坦2Bob Epstein见图2来共同解决数据库性能问题他们选择的方向是硬件。爱泼斯坦担任了Britton-Lee的开发副总裁兼首席架构师。爱泼斯坦是加利福尼亚大学伯克利分校Ingres项目的第三任经理。他是图灵奖得主迈克尔·斯通布雷克Michael Stonebraker的博士生也是斯通布雷克开创Ingres项目时的主要开发者之一。彼时斯通布雷克与王佑曾Eugene Wong和拉里·罗Larry Rowe已经在筹建关系技术公司——RTIRelational TechnologyInc.。RTI的目标是将Ingres商业化。但是爱泼斯坦深知关系型数据库在小型机上的性能极差且只能同时支持少数几个用户。因此他选择加入Britton-Lee希望通过专用硬件提高数据库性能。爱泼斯坦加入Britton-Lee时还从Ingres项目组带走了几位核心成员属实是拆了他导师斯通布雷克的台。2鲍勃·爱泼斯坦Bob Epstein拥有电气工程与计算机科学博士学位专业方向为分布式数据库系统辅修音乐。他早期的职业生涯专注于数据库与网络技术的商业化。1976年至1979年他担任加州大学伯克利分校Ingres项目的负责人。1979年至1984年爱泼斯坦担任Britton-Lee的开发副总裁兼首席架构师。1984年他作为首席架构师和倡导者通过创建Sybase及开发SQL Server推动了客户端/服务器计算模式的发展后者最终通过纳入中间件和开发工具发展成为价值数十亿美元的业务。爱泼斯坦联合创办了Sybase、GetActive Software、Zight和Britton-Lee四家信息技术公司。Britton-Lee的“智能数据库机”Intelligent Database MachineIDM于1981年正式推出比Teradata早3年主要包括IDM 500和IDM 200两种型号。在宣传中他们将IDM称为“真正的数据库机A TRUE DATABASE MACHINE”。这一命名是否似曾相识——Oracle的RAC全称是Real Application Cluster。从“True”到“Real”技术圈里真假难辨最后导致大家在命名上开始较劲。此外数据库一体机从诞生之初就以“智能”为名其核心价值就是通过智能化加持使软硬件协同创造超越用户期待的性能奇迹。图3展示了IDM 500的产品架构。图中清晰显示Britton-Lee IDM的本质是一种数据库加速外设。它必须作为“后端Back-end”连接到大型主机或大型微机无法独立面向终端用户提供计算服务。这种“术业有专攻”的设计正是早期“Database Machine”理念的精髓让计算归计算让数据处理归数据处理。在20世纪80年代计算资源极其昂贵架构分工非常明确。Britton-Lee的设计初衷是“卸载Offloading”。Britton-Lee IDM实际上实现了现代存储界梦寐以求的“近数据计算Near-Data Computing”。传统存储必须把成千上万条原始数据搬运到主机内存再由CPU判断哪些数据符合条件。这会导致主机网络带宽被占满I/O瓶颈。IDM内部集成了处理器和硬件加速器Database Accelerator它在数据离开自己的机箱之前就把不需要的数据“扔掉”了。图3 IDM 500的产品架构图Britton-Lee的IDM数据库机中包含了完整的数据库系统具有清晰完整的技术栈层次其中并发控制、审计日志、崩溃恢复等功能一应俱全。主机系统则负责查询、报表等用户侧功能的实现。到1983年Britton-Lee销售了大约200台IDM数据库机取得了良好的开端。但是行业也在发生变化随着硬件技术的加速进步爱泼斯坦认为为数据库研发专用硬件已无必要应该将优化聚焦于数据库软件层完成客户端/服务器架构的理念在他脑海中形成。图4 Sybase的Logo但是Britton和Lee只想做硬件他们不支持爱泼斯坦的想法。1984年爱泼斯坦离开Britton-Lee并带走了他在这里结识的马克·霍夫曼Mark Hoffman。从伯克利时代一直追随爱泼斯坦的汤姆·哈根3Tom Haggin和简·多尔蒂4Jane Doughty也随后加入。1984年在爱泼斯坦家的后院Sybase如图4所示诞生了。历史总是充满了偶然我们很难假设如果Britton-Lee当时接受了爱泼斯坦的想法那么凭借硬件先发优势和数据库硬核产品的组合会否成长为基业长青的巨头Oracle是否还能崛起但是历史不容假设。在数据库领域Sybase在20世纪90年代异军突起一度挑战了Oracle的王座而后被SAP收购通过HANA再次加入数据库机的赛道此乃后话。Britton-Lee于1985年实现了IPO。到1987年他们已经向150多个客户销售了逾675套数据库机其中包括ATT、杜邦、RCA、法国里昂信贷银行和高盛等。3汤姆·哈根Tom Haggin毕业于加州大学伯克利分校与Bob Epstein为校友及好友。加入Sybase前他在Britton-Lee担任MIS管理信息系统主管负责开发数据库管理系统应用程序。在Sybase他主要负责应用程序接口和开发工具。他是DB-LibrarySybase客户端API和OpenServer服务器端API框架的主要设计者和开发者。他还是ODBC规范前身SQL Connectivity的核心制定者之一。他曾与微软的Kyle Geiger和Jim Gray合作推动了动态SQL的标准化。哈根在Sybase工作了约10年于1994年左右离开。随后他创立Tilden Park Software公司并担任负责人专注于商业软件产品的设计与开发。4简·多尔蒂Jane Doughty毕业于加州大学伯克利分校。Bob Epstein曾评价其编程天赋极高且项目管理能力卓越。在Britton-Lee时期她与Bob Epstein、Tom Haggin等人共同参与数据库技术的开发。她是Sybase的四位联合创始人之一。在公司早期她负责数据库服务器Database Server的工程研发工作是核心技术架构的奠基人之一。她在Sybase 1991年IPO前离开了公司原因是搬迁至外州威斯康星州麦迪逊市。她的丈夫是著名计算机科学家、威斯康星大学麦迪逊分校教授David A. Wood。在技术创新期的瞬息万变中形势可能一夜之间就会逆转。Britton-Lee在1987年经历了数据库机销售的严重放缓当年营收约2500万美元亏损约900万美元。当年第四季度亏损250万至290万美元其中包括为裁减约50名员工占当时280名员工总数的20%所计提的准备金。图5 Britton 和 Lee 的合影1988年1月1日Britton-Lee公司联合创始人大卫·布里顿和杰弗里·李宣布辞职。这使公司总裁兼首席执行官约翰·卡瓦利尔John C. Cavalier得以完全掌控公司。卡瓦利尔于1987年加入Britton-Lee此前他是NCA公司的CEO。NCA后来被Ask Computer Systems公司收购。大卫·布里顿和杰弗里·李在退出公司后基本淡出公众视野图5是互联网上能够找到的唯一一张他们两人的合影。1990年Britton-Lee被Teradata收购。在这一时期Teradata成为“数据库机”领域的唯一幸存者。此处可作一小结专用硬件和通用硬件之争是数据库机成败的关键。其次是硬件与软件之争当硬件进化速度超过软件数据库机就获得关注当软件进化速度超过硬件数据库机就归于沉寂。可谓此起彼伏、此消彼长。1991年9月ATT公司收购了NCR公司后者于12月宣布以约2.5亿美元收购了Teradata。幸运的是Teradata并未在并购中沉沦。2007年1月NCR宣布Teradata将成为一家独立的上市公司。图6是Teradata自2007年以来的收入变化曲线。截至2026年1月底Teradata的市值约为26亿美元。图6 Teradata收入历史趋势图Teradata的目标市场是数据仓库。伴随着开源产品如Hadoop等的普及以及大数据技术的崛起其市场进一步被蚕食。真正为数据库一体机带来复兴的是Oracle。Exadata以通用硬件为基础将数据库一体机从OLAP环境拓展到OLTP环境从而为“数据库一体机”打开了广阔市场开启了真正波澜壮阔的新时代。而云和恩墨的zData更进一步通过分布式存储技术将数据库一体机推进到通用数据库支持范畴实现了统一数据库运行平台的交付大大简化了用户的数据库基础设施架构。从Teradata到Exadata和zData数据库一体机经历了从“专用硬件专用软件”到“通用硬件专用软件特性”再到“通用硬件通用软件”的演进过程如图7所示。图7 数据库一体机的时代演进“专用硬件专用软件”时代早期Teradata使用自研的专用网络交换机和网卡BYNET。BYNET是系统的“神经中枢”负责处理MPP架构中的节点间高速通信、合并排序和消息广播。整个系统被封装在特定的物理机柜中包含定制的存储阵列和容错电源。“通用硬件专用软件特性”时代Exadata设计的核心目标是使用通用硬件采用开放架构实现集成化交付。Oracle采用InfiniBand技术作为网络互连方案在数据库软件层面通过Smart SCAN技术、混合列压缩等专用软件特性实现一体机加速。“通用硬件通用软件”时代zData的设计目标是通过智能化的软件定义存储技术面向数据库场景提供高性能块存储实现软硬件解耦并支持所有数据库产品。用户可采用经官方认证的通用硬件构建自有的数据库统一存储资源池实现性能与成本的自主可控。从以上演进过程可以看到技术的进化是在需求驱动下不断重塑的。例如zData为顺应国内用户的需求从过去仅支持Mellanox的InfiniBand进化为支持更通用的RoCERDMA over Converged Ethernet高速网络技术网络带宽从过去的100Gb扩展为支持从25Gb到200Gb的不同带宽配置硬件平台也从Intel处理器扩展到支持AMD、海光、鲲鹏等处理器支持的数据库更是从Oracle扩展到DB2、SQL Server、MySQL、PostgreSQL、GaussDB、OceanBase、达梦、崖山等数十种。如图8所示zData的进化为用户带来了稳定可靠、性能卓越的数据库运行平台。通过整合的数据库资源池和智能化运维能力数据库管理效率显著提升运营成本也得以优化。图8 云和恩墨数据库一体机从zData到zData X的进化作为补充关系型数据库在诞生之初曾被认为最适合数据仓库场景因为当时其性能表现有限但具备存储更多数据的能力。DB2诞生后就是作为IMS的补充先被尝试用于分析型系统的。而Oracle创始人拉里·埃里森也曾回忆说“我们经历了传统观点所预测的那些非常严重的性能问题。我们始终无法让数据库运行得足够快。我们尝试了一个又一个方法。最终我们取得了突破实现了十倍的性能提升。在最后的测试中我们的性能超越了当时被认为是最快的PDP-11数据库CODASYL系统运行得更快。”图9 埃里克·欧曼再做一个补充当年爱泼斯坦从伯克利带到Britton-Lee的一员大将是埃里克·欧曼Eric Allman见图9。欧曼是sendmail的开发者他的努力对电子邮件传输技术产生了重大影响。sendmail是互联网上最早的邮件传输代理之一欧曼因此于2014年入选互联网名人堂 Internet Hall of Fame。欧曼还是syslog的创造者syslog是几乎所有开放系统和外围设备中使用的事实上的标准日志记录机制。他在Britton-Lee担任首席程序员从事数据库接口软件的开发。作为本篇最后的延展我们通过图10来看一下Britton-Lee的IDM 500一体机在当年的性能表现。由于年代久远此处不再提供测试用例和详细解释但可直观看出数据库机的性能表现非常强劲。图10 Britton-Lee IDM 500的性能表现参考文献http://www.neophilic.com/~eric/History of Sybaseby Bob EpsteinOral History of Mark B. Hoffmanhttp://www.tildenpark.com/who.htmlhttp://www.tildenpark.com/tomresume.htm