视觉中国:基于容器云的同城双活微服务架构上云实践

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 本文正在参加阿里云「最佳上云实践」征文大赛(https://yq.aliyun.com/activity/150),欢迎届时给我们投票 视觉中国集团(Visual China Group)创立于2000年6月,是中国领先的视觉影像产品和服务提供商。

本文正在参加“最佳上云实践”评选,来给我们投票吧:https://yq.aliyun.com/activity/158(编号7)

视觉中国集团(Visual China Group)创立于2000年6月,是中国领先的视觉影像产品和服务提供商。视觉中国集团是以“视觉创造价值,视觉服务中国”为愿景的A股唯一互联网文化创意上市公司(股票代号000681,股票简称:视觉中国)。视觉中国集团以“视觉内容与服务”、“视觉社区”和“视觉数字娱乐”三大业务板块为核心,拥有中国最大的视觉内容互联网版权交易平台,同时为国内的主题公园、城市综合体提供领先的数字娱乐整体解决方案。旗下包括华盖创意(Getty Images China)、汉华易美(China Foto Press)、东星娱乐(TungStar)、视觉ME社区(shijueme)、艾特凡斯(Advance)等业界著名品牌。集团拥有近万名签约摄影师和艺术家,并同海内外数百家图片社、影视机构、版权机构广泛合作,为媒体、企业主、广告公司等各类客户提供专业的图片、影视、音乐、特约拍摄、创意众包、视觉化营销等一站式服务。  

选择云平台 

视觉中国集团目前有分布在北京市各区的5个机房,我们的应用分布在这五个机房,数据间调用复杂且低效,运维维护成本高,每年的预算更是给企业带来一定的负担。为了摆脱这种模式我们决定云化,考察了腾讯云,华为云,ucloud等厂商,最后选择了更能切实解决我们问题且更值得信赖的阿里云平台。

我们采用了基于阿里容器云的同城双活微服务架构(consul+template+registrator),这样既能保证服务的高可用,也在CI,CD方面有所作为。使用到的产品有ECS,RDS,OSS,REDIS,消息通知服务,DATAV,QUICKBI,切图服务,RAM,容器云,云盾,SLB等十几种。

迁移上云 

我们首先进行线下实体机房的微服务的搭建及测试,确保服务可用后进行云化的考量。整个应用迁移过程分为几个步骤:

  • 阿里云资源申请。包括ecs,rds及oss等
  • 容器云测试。简单搭建几个docker测试可用性
  • 部署微服务。基于consul+template+registrator进行部署
  • 代码部署。把jar包等通过jkenins进行部署
  • 功能测试。
  • 性能测试。
  • 灰度发布。A/B test
  • 部分应用迁移。
  • 观察期
  • 整体业务上线
  • 观察期
  • 迁移完毕

整体交付完成之后,我们的CI、CD基本上做了实践,研发发布代码无需经过运维干涉,自动发布,自动部署一键完成。 

云端架构解析

ebf2c55b0c3af2fd70e2098328d9721c7bc7264c


架构要点解读:

  1. 容器集群是Region级别的服务,集群内可以包含多个可用区的ECS。
  2. 容器服务支持将同一个服务的容器调度在不同的可用区(zone)里,这是通过编排模板中的availability:az=xx标签来实现,具体参考:https://help.aliyun.com/document_detail/26018.html?spm=5176.doc26086.6.149.VT2kDs
  3. SLB本身具有跨机房高可用特性,使用主、备在不同可用区的SLB类型即可。

整体架构就是基于容器云的同城双活架构,其实我们还有异地灾备。

交付采取镜像的交付方式,gitlab上传代码后通过jenkins进行打包操作,镜像交付到开发环境,功能验证没问题后,gitlab合并代码到test环境镜像交付后进行test环境的功能及性能测试。

最后将镜像推送至生产环境,生产环境采取双consul多数据中心模式,可用区A连接位于A区的consul master,同时将注册信息同步至位于可用区B的consul master,这样保证多区的微服务集群高可用。

两个区共用基础资源,RDS通过DTS同步至测试环境,测试环境和dev环境共用一套RDS。我们的架构在满足持续交付,持续部署的同时也满足了高可用的需求,每个微服务都是集群,这样基于容器层,ECS层,consul层,微服务层,任何节点出现问题对用户都是不可见的,实现了高可用。 

上云前后分析对比

  1. 成本上可以做到有效的控制,随时做到服务的升降级。
  2. 阿里云帮助我们实现了故障主机的实时迁移,保障了业务的可用性,运维也比较省心。
  3. 在安全方面基于云盾和先知等产品的安全防护可以做到多层次的保障,极大提高了我们的服务安全性。
  4. 监控方面也很细致和全面,支持自定云完全满足我们的需求。成本方面可以随时关注费用中心,自行进行分析。
  5. 效率方面,因为是基于容器云的微服务架构,这方面也有非常大的改善。

以上几点任何一点在传统机房的模式下想做到全面和高效都是比较困难的,这也是我们为何进行云化的原因。 

上云遇到的问题及解决方法

遇到的问题还是比较多的,我列举几个典型的问题。

  1. 中美oss同步大文件有数据重传问题及日常传输方案。稳定性建议采取高速通道,日常传输采用multipart分块实现
  2. 云端支持批量上传数据的压缩及打包下载解压缩功能。通过udf实现
  3. oss子账户授权后只能看到自己目录内容。通过ossfs实现
  4. 跨境oss数据接收后无法确实该删除的文件。通过跨境消息通知机制实现
  5. 跟进不同的图片主题进行切图参数的相关匹配。通过智能识图完成
  6. 数据大屏展示。通过datav和quickbi实现
  7. ddos攻击防护。通过高防ip及waf防火墙实现
  8. 容器云日志采集和查看。通过sls实现

 

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
2
分享
相关文章
极氪汽车云原生架构落地实践
随着极氪数字业务的飞速发展,背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验,并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。
阿里云SLB深度解析:从流量分发到架构优化的技术实践
本文深入探讨了阿里云负载均衡服务(SLB)的核心技术与应用场景,从流量分配到架构创新全面解析其价值。SLB不仅是简单的流量分发工具,更是支撑高并发、保障系统稳定性的智能中枢。文章涵盖四层与七层负载均衡原理、弹性伸缩引擎、智能DNS解析等核心技术,并结合电商大促、微服务灰度发布等实战场景提供实施指南。同时,针对性能调优与安全防护,分享连接复用优化、DDoS防御及零信任架构集成的实践经验,助力企业构建面向未来的弹性架构。
167 76
千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践
碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构,解决了海量数据处理中的资源利用率低、并发能力不足等问题,显著降低了硬件和运维成本。实时查询性能提升8倍,查询出错率减少30倍,集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验,还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。
MCP 实践:基于 MCP 架构实现知识库答疑系统
文章探讨了AI Agent的发展趋势,并通过一个实际案例展示了如何基于MCP(Model Context Protocol)开发一个支持私有知识库的问答系统。
MCP 实践:基于 MCP 架构实现知识库答疑系统
云原生时代的应用架构演进:从微服务到 Serverless 的阿里云实践
云原生技术正重塑企业数字化转型路径。阿里云作为亚太领先云服务商,提供完整云原生产品矩阵:容器服务ACK优化启动速度与镜像分发效率;MSE微服务引擎保障高可用性;ASM服务网格降低资源消耗;函数计算FC突破冷启动瓶颈;SAE重新定义PaaS边界;PolarDB数据库实现存储计算分离;DataWorks简化数据湖构建;Flink实时计算助力风控系统。这些技术已在多行业落地,推动效率提升与商业模式创新,助力企业在数字化浪潮中占据先机。
105 12
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
102 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
微服务架构演变与架构设计深度解析
【11月更文挑战第14天】在当今的IT行业中,微服务架构已经成为构建大型、复杂系统的重要范式。本文将从微服务架构的背景、业务场景、功能点、底层原理、实战、设计模式等多个方面进行深度解析,并结合京东电商的案例,探讨微服务架构在实际应用中的实施与效果。
306 6
微服务架构演变与架构设计深度解析
【11月更文挑战第14天】在当今的IT行业中,微服务架构已经成为构建大型、复杂系统的重要范式。本文将从微服务架构的背景、业务场景、功能点、底层原理、实战、设计模式等多个方面进行深度解析,并结合京东电商的案例,探讨微服务架构在实际应用中的实施与效果。
144 1
从单体到微服务:如何借助 Spring Cloud 实现架构转型
**Spring Cloud** 是一套基于 Spring 框架的**微服务架构解决方案**,它提供了一系列的工具和组件,帮助开发者快速构建分布式系统,尤其是微服务架构。
429 69
从单体到微服务:如何借助 Spring Cloud 实现架构转型