如丝般顺滑的2017阿里双11黑科技曝光

简介: 双11前夕,阿里巴巴集团CTO行癫就给阿里两万多位工程师下了一个很新鲜的KPI——“双11晚上,大家的主要任务是喝茶。” 能如此淡定喝茶的背后,除了无数阿里技术小二的才智与努力,还有很多阿里的黑科技支撑着这样世界超级工程。现在我们跟着阿里云云效一起来揭秘下有哪些基础设施黑科技?
2017双11全球狂欢节,阿里再创奇迹,成交金额1682亿,交易峰值32.5万/秒,支付峰值25.6万/秒,数据库处理峰值4200万次/秒。

双11前夕,阿里巴巴集团CTO行癫就给阿里两万多位工程师下了一个很新鲜的KPI——“双11晚上,大家的主要任务是喝茶。”

17c18b6a6b989fa84cfe793a86422dd105a02a00

能如此淡定喝茶的背后,除了无数阿里技术小二的才智与努力,还有很多阿里的黑科技支撑着这样世界超级工程。现在我们跟着阿里云云效一起来揭秘下有哪些基础设施黑科技?

4d8e60c416d8b10cd7fc85fbab55d82d02cee22a

蜻蜓——世界领先的大规模文件分发系统

黑科技指数:

解决痛点:大规模文件分发稳定性差、效率低、成本高的难题,解决大规模镜像分发的成功率、效率难题。

实践效果:平均每天上百万次下载,TB级数据分发。平均成功率99.9999%。全集团覆盖率90%以上。解决了跨机房,跨地域,跨国际的分发难题,可以全天候,全球范围内提供不间断的服务。支撑了双十一大规模快速建站。兼容Docker mirror协议,支持Docker,Pouch,Hyper。

产品推荐:蜻蜓即将在阿里云云效中开放对外,赋能更多阿里云企业用户,帮助企业解决跨积分、跨地域、跨国际的文件分发难题。


Sigma——阿里所有服务器像一台机器一样被管理

黑科技指数:

解决痛点:为了保证系统的在线交易服务顺利运转,最初几年,阿里都是在大促来临之前大量采购机器储备计算资源,双 11 之后资源大量闲置。是否能把计算任务与在线服务进行混合部署,在现有弹性资源基础上提升集群资源利用率,降低双 11 资源新增成本?

实践效果:2017年双 11,Sigma调度可以跨多个不同平台来分配双11所需资源,使双11IT成本降低50%;混部技术把服务器资源利用率提升30%,复用计算任务集群为双11节约大量服务器,全网Pouch化实现阿里在线服务全面容器化,内部达到百万级容器部署规模。基于资源弹性和混部技术的云化战略又一次为双 11 带来成本的降低,未来这样具有混部能力的混合云弹性能力将通过阿里云开放,让用户以更低的成本获得更强的计算能力,进而帮助整个社会提高资源效率。

混部技术详细解读:欢迎关注 云效(ali_yunxiao)微信号,回复 混部即可。

StarAgent——百万级运维通道

黑科技指数:

解决痛点:还记得哪些年我们半夜爬起来重启服务器的暗黑历史吗?如何保证百万量级主机管理能安全、稳定、高效,如丝般顺滑?

实践效果:StarAgent支持百万级规模服务器管控,通过基于消息的分布式架构改造,1秒可操作上万台服务器,系统具备多中心部署能力,单机房/单存储故障不影响业务,高危操作自动识别与拦截有效第保证系统安全。

产品推荐:智能运维产品将在 阿里云云效平台对外输出。


X-Cluster——阿里10年分布式数据库技术沉淀 

黑科技指数:

解决痛点:2014 双11随着业务高速的增长,同城主备 AliSQL 部署的方式已经无法满足阿里对可扩展的部署、国际化以及容灾方面的需求。“异地多活”成为了公司应用的新标准。“异地多活”也给底层的数据库提出了新的容灾要求。传统的 Master-Slave 架构下,主备如果不使用强同步模式就会存在数据丢失的可能,然而强同步下一旦有节点异常,则整体不可服务。

实践效果:X-Cluster是阿里巴巴自研的分布式数据库。2017年双11,X-Cluster服务于淘宝天猫核心交易系统,经受了零点压力峰值的考验,并且在数据质量得到保证的前提下,提供了高效稳定的跨单元数据同步服务。

X-Cluster技术详细解读:欢迎关注 云效(ali_yunxiao)微信号,回复 X-Cluster即可。

网络自愈技术

黑科技指数:

解决痛点:作为一名工程师,网络无疑是最最基础的,一旦出现其中一个方向的网络故障,就会影响成千上万甚至亿级用户的正常使用,如何保证网络稳定运行? 

实践效果:通过实时准确的故障发现和故障收敛能力,结合自动化恢复,2017年阿里巴巴网络已经具备自愈能力,全面保障双11全体业务的稳定运行。

Aone——一站式项目生命周期管理

黑科技指数:

解决痛点:双11的交付时间不可妥协,所有工作必须在11.11之前全部ready,这就要求项目必须按计划交付,但1000+的项目计划制定的是否合理?是否满足双十一的节奏?项目交付是否按计划完成?过程如何check?信息透明是PM在双11项目管理最大的挑战。
 
实践效果:2017年双11,Aone支持30+个BU,100+个核心产品,1000+个垂直项目,在2个月时间里,几千人共同协作完成双十一大促的所有准备工作。
 
产品推荐:Aone作为阿里巴巴集团统一一站式研发协同平台,提供一站式项目生命周期管理流程,从需求-计划-协作-风险-跟踪-反馈环环相扣,并与构建发布流水线进行有机集成;支持Scrum和看板模式,通过里程碑、项目等级分层、漏斗式式风险管理, 将双11的项目进度准确无误地传递到各个业务和组织;同时,通过数据度量和舆情监控,反馈项目进展数据,自动计算任务状态停留时长,找出效率瓶颈。通过舆情监控,将用户的反馈声音第一时间反馈给产品、开发,将缺陷快速关联到对应的产品、开发。
    
Aone的项目管理功能除了满足天猫双11,还为阿里其他部门业务一起进行高效项目管理、协同办公,包括蚂蚁金服、菜鸟、大麦网等,也正在对外,为一万多家外部企业用户提供高效协同服务,对外的产品名称叫阿里云云效,赋能阿里云大中型企业及发展中的创新企业。
 

PS:关注云效,学习更多阿里双11黑科技。点击 云效,体验黑科技!

3b1f69f9eee8ee61c7d192db7e39adb38f93eeb8


相关实践学习
基于函数计算一键部署掌上游戏机
本场景介绍如何使用阿里云计算服务命令快速搭建一个掌上游戏机。
相关文章
|
3天前
|
Kubernetes 测试技术 微服务
白天大流量下发布依然如丝般顺滑
为什么很多互联网公司不敢在白天发布,都选择在半夜发布。要是能摆脱半夜发布的窘境,它不香吗?选择在半夜发布无非是为了减少对用户的影响,出了问题影响面可控。那我们就来谈谈,发布会有哪些问题若您的应用没有上下线的问题,您的任何应用在发布的过程中会造成短暂的服务不可用,短时间内业务监控会出现大量 io 异常...
白天大流量下发布依然如丝般顺滑
|
监控 容灾 NoSQL
【TICA大咖】大促场景下,如何保障未来玩法的功能确定性
阿里QA导读:TICA2022如期报到,将于2022年12月15日正式举办,第四次跟大家见面,我们诚意满满,期望给大家带来更多干货。从本周末开始,小编将开启【TICA大咖】频道,每周六跟大家分享TICA各会场出品人的精彩文章,本周文章来自工程效能分会场出品人-太禅老师,讲述如何通过创建隔离环境并修改系统时间,让亿级买家、千万级商品提前过双11,并观察核心交易链路上的功能可用性。
651 0
【TICA大咖】大促场景下,如何保障未来玩法的功能确定性
|
存储 对象存储 数据安全/隐私保护
借助阿里云,Wyingo如何让海淘之旅如丝绸般顺滑
为了积累高质量私域流量, Wyingo株式会社部署了独立站网店,给客户提供日本产品在线交易。因为业务规模持续发展壮大,网店访问量、交易量随之水涨船高。为了更好地打理店铺,Wyingo株式会社在通过前期的咨询与考察后,采用了阿里云的产品对象存储OSS。
474 0
借助阿里云,Wyingo如何让海淘之旅如丝绸般顺滑
|
弹性计算 边缘计算 资源调度
大促密集,CDN如何保障电商体验如丝般顺滑?
前不久,阿里云技术天团空降CSDN在线峰会,对核心技术竞争力进行解读。其中,阿里云高级技术专家曾福华分享了《双11: CDN如何保障电商大促如丝般顺滑》的议题。俗话说:养兵千日,用兵一时。每一次的战役,后面都有无数的团队、无数的预案以及无数的演练在支撑着。双十一的稳定,不仅仅有各种创新各种高科技,还有非常多的体系化工程给与了足够的保障,从物理层到应用层,从资源准入到线上演练,无一不例外的都蕴含着各种门道。面对电商大促,面对百 Tbps 级别的流量,阿里云 CDN 又是如何确保如丝般顺滑的呢?
3716 0
大促密集,CDN如何保障电商体验如丝般顺滑?
|
弹性计算 人工智能 Cloud Native
看尽双11黑科技,来这就够了
自09年11月11日起,11月11日就被赋予了全新的定义,阿里妹相信,于开发者,这背后的科科技全貌更为令人着迷,为此阿里云开发者社区运营组就主动请缨来啦!
看尽双11黑科技,来这就够了
|
人工智能 运维 监控
阿里云启用五大超级数据中心支撑双11 :“剁手”体验丝般顺滑
今年双11阿里云超级数据中心放大招了,启用全球最大液冷数据中心支撑双11,液冷服务器、机器人巡逻。
49794 0
阿里云启用五大超级数据中心支撑双11 :“剁手”体验丝般顺滑
|
人工智能 算法 双11
天猫精灵21款妙物黑科技曝光,这个双11要热闹了!
未来的天猫精灵将有机会成为人们生活中一个“无处不在”的AI助手
天猫精灵21款妙物黑科技曝光,这个双11要热闹了!
|
供应链 机器人 双11
重大发布!今年天猫双11多三天,光棍节变双节棍,玩法亮点全在这里
挺品牌、挺商家、挺工厂、挺消费者,2020天猫双11注定不一样。
重大发布!今年天猫双11多三天,光棍节变双节棍,玩法亮点全在这里
|
大数据
从直播商城系统的KOL效应分析,直播带货井喷的必然性
网红营销、直播带货作为近年来的热点发展迅猛,同时也捧红了一个概念:KOL。随着直播商城系统的不断完善发展,让KOL成为近年来营销最热门的香饽饽。随着原创直播平台低门槛化、模板化内容创作和大数据智能分发体系的完善,用户的高质量内容生产效率得到颠覆性的提升,每个用户都有可能生产出专业级别的内容,成为领域的中高部KOL。
|
Web App开发 编解码 移动开发
淘宝超强“带货王”——直播低延迟的背后有何猫腻?
本次演讲来自阿里巴巴淘系技术部技术专家常高伟在 LiveVideoStack 2019深圳站上的演讲,主要面向直播行业从业者,以及对低延迟直播技术、 WebRTC 技术感兴趣的技术人员,介绍淘宝直播在低延迟直播技术上的探索,如何基于 WebRTC 实现一秒内的低延迟直播,以及低延迟直播对电商直播的业务价值。
2443 1
淘宝超强“带货王”——直播低延迟的背后有何猫腻?

热门文章

最新文章