谊品生鲜:放弃传统数据库架构,全站上阿里云

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 本文转载自中国软件网,作者:曹开彬

疫情之下,生鲜电商的订单突然暴涨。

社区生鲜龙头企业谊品生鲜就是一个典型代表。它的在线交易量激增,日订单量超过10万单。

对电商企业而言,这对业务是个巨大的好消息;但对于IT、对于谊品生鲜的核心业务系统则是一个巨大的挑战!

所有做互联网、做电商核心业务系统的技术人员都知道,访问量容量巨增,这对于后台系统会带来各种不可预知的问题:性能卡顿,网站、APP、小程序等入口不能访问,订单出错,支付不了……

要命的是,出现其中的任何一个问题,都会对业务、对用户体验、对品牌造成巨大伤害。

更进一步,万一出现了某个问题(说实话,这世界谁也不能保证100%不会出现),而IT却不能快速解决,将会是灾难性的后果。
image.png
作为谊品生鲜IT基础架构的负责人,杨航深知其中滋味。

但幸运的是,他告诉中国软件网,这次他闯过来了。

而记者也发现,他的闯关经历,或许是电商企业、甚至是互联网公司应对业务量暴增的、实现可控、健康运营的“最佳实践”。

01 传统ERP被厂商卡脖子

为应对业务的快速扩张,2018年年底,谊品生鲜成立了研发团队。同时,开始大量采购第三方系统,例如ERP、仓储、供应链等。

这些系统都基本上是本地部署,自己买服务器,数据库基本都采用Oracle。

这些第三方业务系统往往有一个共同的特点,即核心业务逻辑往往都写在Oracle数据库里。

这就带来了一个巨大的风险:一旦系统出了问题,谊品生鲜自己的技术人员往往无法解决,必须要有系统研发厂商的DBA等相关技术人员协助才能解决。
image.png
阿里云数据库资深技术专家、数据库自治服务DAS产品线负责人李广望介绍,这其实是很多电商企业面临的一个典型场景。

这种传统的数据库架构,最怕系统出问题。因为一出问题时,自己没法解决,必须依靠厂商的技术人员才能解决。

但由于厂商的技术人员不可能马上响应,也不可能立即到现场解决,这种情况下解决一个问题需要花费很长时间。

这对于每分钟都有巨大业务量的互联网企业而言,这绝对是不能忍受的。

例如,谊品生鲜有次进行门店盘点,却出现没办法提交盘点成果的现象。谊品技术人员很快排查发现,原因是系统的Oracle数据库阻塞了。

“这涉及到第三方系统,我们自己的技术人员无法解决。必须要找ERP厂商,让他们的DBA来处理。”

当时解决这个问题,花了很长时间。这给谊品生鲜带来了极大的损失。

对于电商企业而言,这种情况其实是“被厂商卡住了脖子”。自己有技术人员,却无法冲上去解决问题。

这个问题必须解决。否则,电商业务系统的可靠性与稳定运行将有巨大的不可控风险。

02采用云原生架构自研系统

从阿里巴巴、京东、百度、美团等互联网企业的实践来看,中国软件网发现,解决这个问题的根本途径就是——自已研发核心业务系统。

如果采用第三方系统,永远存在不可控的风险。

而对于互联网企业,核心业务系统是自己的命根子。它必须绝对可控,容不得有半点闪失。

要绝对可控,就必须自己研发系统。

另外,每个互联网或电商企业,其实都有独特的供应链模式、运营模式。市场上很难找到一个第三方系统能够很好地支撑他们的运营。

就像谊品生鲜,在开始的三年,由于需求无法满足的原因曾经换过几个系统。

每次换系统都是一个非常痛苦的过程。这也是谊品生鲜决定成立自己的研发中心,自己的研发系统的关键原因。

因此,谊品生鲜下定决心自己组建专门的IT研发团队,自已研发核心业务系统。杨航甚至还向中国软件网透露,未来所有系统都要由谊品生鲜自研,包括财务软件。

在云时代,自研系统必须采用云原生技术,这样才能有效解决传统ERP等业务系统的架构不合理,同时又能研发完全符合自己需求的系统。

03数据库上云、去Oracle

资深架构师都知道,保证业务系统可控的核心在于数据库。

自研系统要绝对可控,数据库用什么呢?

大家的第一个共识是,不能再用Oracle。

原因主要有两个。一是Oracle在技术上不可控;二是Oracle成本太高,Oracle的云数据库版本也较少,与之对应的云上运维与管理工具也比较少。

第二个共识是,数据库要上云,要用云数据库。权威市场研究机构Gartner指出,云数据库将是未来。到2021年,云数据库在整个数据库市场中的占比将首次达到50%;而到2023年,75%的数据库要跑在云平台之上。
image.png
最核心的原因是,传统数据库产品存在扩展速度慢、效率低等问题,根本无法满足业务系统对实时性、稳定性、快速扩容的需求。

就像谊品生鲜因疫情而突然在线交易量激增,日订单量超过10万单。本地部署的传统数据库很难应对这种爆发式的增长,实现弹性扩缩容。

但这是云数据库的强项。

云原生数据库往往采用利用分布式共享存储,并且存储和计算分离、解耦,以方便在存储和计算分别进行弹性扩容,做到极致的弹性。在弹性、高可用、负载均衡等方面,云数据库基本都是明显优于本地部署的数据库。

并且,云数据库可以做到“按需按量使用,同时按需按量计费”。这对于互联网企业而言极具吸引力。

如果用本地数据库,要做到和云数据库一样的高可用性,成本就会非常高。

对于谊品生鲜而言,由于其服务器等硬件基础设施已全面上云。系统上云、数据库上云也是一个必然趋势。

最初谊品生鲜的业务系统采购自第三方厂商,并且部署在线下IDC机房内。一旦出了问题就只能等厂商的人来解决问题。

但现在,通过将全部业务迁移到阿里云之上,并且深度使用云数据库,杨航带领的基础架构团队才终于感觉有了控制权。

04自治化与智能化

对于互联网和电商企业而言,随着自研系统的增多,数据库运维与管理的挑战将会越来越大。

对于谊品生鲜同样如此。杨航下一步的解决方案是,谊品生鲜自己的技术运维团队会更侧重于内部运维效率平台的研发,以此逐步减少DBA人员,降低运维成本、控制安全风险。

同时,DBA的传统职能会被淡化掉,他们主要用于研发效率工具、自治服务工具,做更高价值的工作。自研系统迭代速度非常快,如果没有数据库的自治服务,不能实现自动化、智能化运维,还需要大量人工运维介入,会大大增加线上系统出故障的几率。

巧合的是,这也正是阿里云数据库自治服务DAS产品的发展目标。

DAS产品最早源于2014年的CloudDBA,是一个服务于内部的研发人员工具。2016年,阿里云对它进行了升级和产品化,作为云服务推向了市场。从2017年开始阿里云在其中加入自治功能,并利用阿里巴巴的场景和技术不断验证和完善,一直持续到2019年年底,正式更名为DAS。
image.png
作为阿里云数据库DAS产品线负责人,李广望深有感触,阿里云数据库自治服务DAS基于阿里巴巴自身数据库规模化运维的专家经验,结合人工智能和机器学习技术,已实现了自感知、自诊断、自修复和自安全的数据库自动驾驶能力。

正是这个数据库自治服务产品打动了杨航。

据杨航介绍,谊品生鲜的所有自研系统都基于云服务,所有的云服务都和阿里云深度合作。

谊品生鲜选择阿里云的原因有两个。第一个是谊品生鲜已经是阿里云IaaS用户。所有的硬件基础设施都在阿里云上,云数据库也能使用阿里云是最好的选择。

第二个原因更为重要。他们是看上了阿里云在云数据库方面的生态完整性

杨航认为,数据库运维与管理的便捷性、总体拥有成本是选择哪个厂商的云数据库时必须要考虑的重要因素。

对于互联网公司或电商企业而言,他们不能在数据库运维方面投入太多人员,否则成本太高,也特别容易出问题。

杨航团队曾对国内市场上的数据库运维与管理工具做过详细比较,相对而言,阿里云DAS具有比较明显的优势。例如,其功能全面性比其他国内厂商好,控制台及账单功能比国外厂商好。

并且在合作的过程中,阿里云数据库对谊品反馈问题的处理效率非常高,并且产品质量非常有保障。谊品生鲜对阿里云的服务支持非常满意。

对于谊品生鲜这样的电商企业来说,数据库运维效率工具要能完全地将运维团队的工作流程和研发团队的开发流程结合起来。也即是说,阿里云DAS要和谊品生鲜内部效率平台结合起来,赋能给研发人员。例如,云上数据库出现了告警,DAS未来要能把问题直接转给相应的研发人员,从而提升效率。

按这种模式,以前他们处理一个故障平均需要10-20分钟,要人肉排查故障,应用了阿里云DAS之后,只需几分钟,问题就能得到定位和解决,效率提升非常明显。

正是借助数据库自治服务DAS,谊品生鲜自研系统的运维只需要几个人就能搞定。通过上云和深度使用云数据库,谊品生鲜总体数据库使用成本降低了40%~50%

在中国软件网看来,谊品生鲜利用云原生技术、采用云数据库自研系统的实践意义还不仅如此。它最重要的是为同行们提供了在数字世界里应对未知性、掌握可控性的一个方法。

想要get谊品生鲜同款“自动驾驶神器”?

点击文字

立即体验数据库自治服务DAS

相关实践学习
使用DAS实现数据库自动扩容和回缩
暂无
目录
相关文章
|
30天前
|
弹性计算 运维 安全
阿里云资深架构师经验分享——DevSecOps最佳实践
本文将分享阿里云在DevSecOps中设计环节的实践经验,希望能够让大家理解阿里云是如何保障产品安全水位,并希望这些经验能够帮助到正在尝试落地DevSecOps解决方案的企业。
520 167
阿里云资深架构师经验分享——DevSecOps最佳实践
|
12天前
|
弹性计算 负载均衡 网络协议
阿里云SLB深度解析:从流量分发到架构优化的技术实践
本文深入探讨了阿里云负载均衡服务(SLB)的核心技术与应用场景,从流量分配到架构创新全面解析其价值。SLB不仅是简单的流量分发工具,更是支撑高并发、保障系统稳定性的智能中枢。文章涵盖四层与七层负载均衡原理、弹性伸缩引擎、智能DNS解析等核心技术,并结合电商大促、微服务灰度发布等实战场景提供实施指南。同时,针对性能调优与安全防护,分享连接复用优化、DDoS防御及零信任架构集成的实践经验,助力企业构建面向未来的弹性架构。
147 76
|
12天前
|
Cloud Native Serverless 流计算
云原生时代的应用架构演进:从微服务到 Serverless 的阿里云实践
云原生技术正重塑企业数字化转型路径。阿里云作为亚太领先云服务商,提供完整云原生产品矩阵:容器服务ACK优化启动速度与镜像分发效率;MSE微服务引擎保障高可用性;ASM服务网格降低资源消耗;函数计算FC突破冷启动瓶颈;SAE重新定义PaaS边界;PolarDB数据库实现存储计算分离;DataWorks简化数据湖构建;Flink实时计算助力风控系统。这些技术已在多行业落地,推动效率提升与商业模式创新,助力企业在数字化浪潮中占据先机。
82 12
|
13天前
|
Cloud Native 关系型数据库 MySQL
华鼎冷链科技 × 阿里云瑶池数据库,打造全链路协同的智慧冷链新标杆
从 PolarDB 的高性能数据库服务到 AnalyticDB 的强大数据分析,阿里云提供的丰富产品矩阵为华鼎冷链科技构建了全面的解决方案,推动华鼎冷链科技从成本中心向效率中心转型。
|
25天前
|
存储 弹性计算 运维
阿里云通用算力型U1实例怎么样?u1实例技术架构、场景适配与优惠价格参考
阿里云服务器ECS 通用算力型u1实例2核4G,5M固定带宽,80G ESSD Entry盘,企业用户专享优惠价格199元1年,很多用户关心这个款云服务器怎么样?阿里云通用算力型U1实例自推出以来,凭借独特的"均衡算力+智能调度"设计理念,在IaaS市场开辟出差异化的竞争赛道。本文将通过技术架构解析、典型场景适配分析、全生命周期成本测算三个维度,全面解构这款热门云服务器实例的核心价值,以供参考和选择。
|
10天前
|
人工智能 关系型数据库 分布式数据库
让数据与AI贴得更近,阿里云瑶池数据库系列产品焕新升级
4月9日阿里云AI势能大会上,阿里云瑶池数据库发布重磅新品及一系列产品能力升级。「推理加速服务」Tair KVCache全新上线,实现KVCache动态分层存储,显著提高内存资源利用率,为大模型推理降本提速。
|
2月前
|
Cloud Native 关系型数据库 分布式数据库
世界第一!阿里云PolarDB刷新全球数据库性能及性价比记录
世界第一!阿里云PolarDB刷新全球数据库性能及性价比记录
|
1月前
|
运维 安全 弹性计算
基于阿里云的开源应用智能管理架构设计与工程实践
本文以Websoft9技术方案为例,探讨企业级应用管理的范式。通过解析开源应用管理面临的部署复杂性、运维低效性和知识碎片化三大挑战,提出基于阿里云的三层架构:智能应用管理门户、核心功能层和基础设施层。文章详细阐述了应用编排标准化(IaC实践)、智能运维体系构建及知识资产数字化的技术实现路径,并结合金融与制造行业的案例,展示解决方案的实际效果。最后提供开发者资源与工具链支持,助力企业高效管理应用。
117 1
|
1月前
|
安全 容灾 网络安全
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等