云原生
阿里云拥有丰富的云原生产品家族,全面的云原生开源贡献,大规模的云原生应用实践,以及广泛的云原生客户群体,为企业数字创新提供全方位能力支撑。
提供完全兼容开源生态的各种应用组件监控,提供开箱即的监控大盘和告警,阿里云提供全托管服务.Prometheus 监控服务.数据可视化平台Grafana服务全托管免运维,默认集成数据库RDS、消息队列MQ、实时计算Elasticsearch、Prometheus监控、日志服务SLS等数据源,并提供丰富数据看板模板,让数据可视化更加高效、精细.Grafana ...
来自: 云产品
企业级高可用架构解决方案
企业级高可用架构解决方案通过全链路压测、容量规划、多维流控防护、架构感知、故障演练、预案体系和异地多活等技术方案为企业提供营销活动全面保障、整体成本控制、应急应对能力和全面的容灾逃逸能力。
一款应用性能管理产品,包含前端监控,应用监控和 Prometheus 监控三大子产品.应用实时监控服务 ARMS.基于阿里巴巴高可用解决方案三个月走完阿里巴巴三年的多活改造之路。基于其自身特殊业务场景结合阿里解决方案落地,提升了业务连续性、灾备效率和成本,为运营创新提供支撑.罗辑思维在全链路压测方面的实践.PTS助力懂球帝...
来自: 解决方案
性能测试PTS
阿里云性能测试PTS可轻松模拟任意体量的用户访问业务的场景。任务随时发起,免去繁琐的搭建和维护成本。是活动大促、产品交付、版本迭代、系统维护不可缺少的性能优化工具。
应用实时监控服务 ARMS.针对 PHP、C++、Go、Node.js 等多语言应用,提供端到端全链路追踪、应用监控与告警、链路拓扑、日志关联分析能力,并基于 OpenTelemetry 开源标准,兼容 Jaeger、Zipkin、SkyWalking 等开源项目数据上报。快速发现分布式应用架构下的性能瓶颈,缩短错/慢调用根因定位耗时,提高全栈开发与诊断效率.可...
来自: 云产品
可观测链路 OpenTelemetry 版
针对 PHP、C++、Go、Node.js 等多语言应用,提供端到端全链路追踪、应用监控与告警、链路拓扑、日志关联分析能力,并基于 OpenTelemetry 开源标准,兼容 Jaeger、Zipkin、SkyWalking 等开源项目数据上报。快速发现分布式应用架构下的性能瓶颈,缩短错/慢调用根因定位耗时,提高全栈开发与诊断效率。
应用实时监控服务 ARMS.作为云原生的运维数据可视化平台,面向用户提供免运维和快速启动 Grafana 运行环境的能力,默认集成如数据库 MySQL、消息队列 RockteMQ、实时计算 Flink、Elasticsearch、可观测监控 Prometheus 版、日志服务SLS等各类阿里云服务数据源,并提供丰富的数据看板,让运维监控更加高效、精细.可观测可视...
来自: 云产品
AHAS多活容灾MSHA
多活容灾MSHA是在阿里电商业务环境演进出来的多活容灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供容灾架构建设能力。横向支持容灾架构的上线、运维、演练、切流,升级到下线。纵向支持业务流量的全链路管理,从流量接入到服务化调用再到异步化消息,最终完成数据落库。
应用实时监控服务是一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,涵盖了浏览器、小程序、APP、分布式应用和容器环境等性能管理,能帮助你实现全栈式的性能监控和端到端的全链路追踪诊断,让应用运维从未如此轻松高效.应用实时监控服务 ARMS.企业级分布式应用服务 EDAS是应用全生命周期管理和...
来自: 云产品
故障演练Chaos
故障演练(Chaos)是阿里云打造的云原生混沌工程平台,场景丰富、简单易用、安全可控、高效可靠,提供一站式架构分析、故障巡检等功能,帮助系统平稳上云。
应用实时监控服务是一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,能帮助你实现全栈式的性能监控和端到端的全链路追踪诊断,让应用运维从未如此轻松高效.应用实时监控服务 ARMS.更多产品与服务.一键接入阿里云主机和Ack集群环境,也支持非阿里云的客户自建环境.覆盖社区版ChaosBlade的所有场景...
来自: 云产品
服务中心解决方案
注册中心和配置中心是 Dubbo 和 Spring Cloud 微服务架构中的重要组件,往往采用 ZooKeeper/Nacos/Eureka/Apollo 等开源方案进行自建,但因其依赖复杂,往往给客户带来的较高的建设和运维成本,同时,在 Hbase、Spark或Kafka 等大数据的环境下,会依赖 ZooKeeper 进行分布式系统的协调,此时,基于云上的托管服务,可以极大的降低运维复杂度,并提高应用可用性。
企业级分布式应用服务 EDAS.ARMS一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,涵盖了浏览器,小程序,APP,分布式应用和容器环境等性能管理.应用实时监控服务 ARMS.阿里云微服务中心解决了依赖 ZK/Nacos/Eureka 等开源注册和配置方案进行自建过程中引起的依赖复杂、建设和运维成本高的问题,...
来自: 解决方案
云基础产品与基础设施
云基础产品与基础设施作为阿里云产品六大版块之一,主要包含弹性计算、存储、网络、安全、云原生应用平台以及无影和基础设施类产品,向客户提供高度自动化的标准化产品对网络功能、计算机(虚拟或专用硬件)和数据存储空间进行访问,同时支持灵活扩展,可以直接使用自助服务界面。
容器服务 ACK 发行版.Prometheus 监控服务.Grafana 服务.事件总线 EventBridge.云服务总线 CSB.云原生应用交付平台 ADP.Serverless 工作流.服务网格 ASM.应用配置管理 ACM.云原生应用平台.API 网关.运维事件中心.智能顾问 Advisor.云治理中心.云迁移中心.服务器迁移中心 SMC.智能计算灵骏.云解析 PrivateZone.云解析 DNS....
来自: 云产品
业务中台技术解决方案
阿里云业务中台解决方案为企业构建业务中台提供体系化的建设解决方案,涵盖从中台架构设计、中台实施、运行支持、持续治理等一整套业务中台建设方法论体系。阿里云业务中台解决方案基于经过阿里多年双十一洗礼的成熟云原生产品,结合完善的生态伙伴体系,成功帮助大量企业实现业务的实时在线与统一,实现各业务板块之间链接和协同,持续提升业务创新效率。
消息队列 RocketMQ.ARMS是应用性能管理产品,包含前端,应用Prometheus监控,涵盖了浏览器,APP,分布式应用和容器环境等性能管理,实现全栈式性能监控和全链路追踪诊断.应用实时监控服务ARMS.PTS是面向所有技术背景人员的云化测试工具。PTS以互联网化的交互,提供性能测试、API调试和监测等多种能力。可以轻松模拟任意...
来自: 解决方案
监控
云监控(CloudMonitor)是阿里云提供的一款一站式、全链路、开箱即用的监控产品。涵盖云上云下统一的主机监控、百余款的云产品监控、覆盖全球的网络监控、面向应用和业务的日志监控和自定义监控,提供丰富的指标数据和强大开放的平台能力,帮助客户第一时间发现和定位问题构建完善的监控运维体系。
更多产品与服务.更多产品与服务.函数计算(Function Compute)是一个事件驱动的全托管 Serverless 计算服务,您无需管理服务器等基础设施,只需编写代码并上传,函数计算会为您准备好计算资源,并以弹性、可靠的方式运行您的代码....云监控提供全方位智能化高效的监控服务,助您提升服务稳定性,降低运维成本.查看全部日志.
来自: 云产品
云原生可观测运维解决方案
阿里云云原生可观测运维解决方案基于SLS云原生可观测平台实现,以大数据源为支撑,兼容开源标准,可实现多场景适配AI算法,进行大规模数据处理分析。是阿里云针对企业级大数据运维场景推出的解决方案,帮助企业在日常运维工作中轻松实现异常检测、根因分析、秒级响应以及实时预测。
✓ 日志服务支持通过 Webhook 方式接收外部监控系统中的告警消息(如 Grafana、Prometheus),无须迁移数据即可接入智能告警 ✓ 通过开放告警接入数据后,即可使用日志服务智能告警功能中的智能降噪及告警事件管理功能.✓ 无须迁移数据即可快速解决告警风暴问题 ✓ 多个服务统一告警中枢更易于告警事件管理.跨服务统一告警...
来自: 解决方案
游戏系统和业务运维及分析解决方案
游戏系统和业务运维及分析解决方案,通过阿里云日志服务 SLS、对象存储 OSS 等产品,帮助客户构建简单、易用、性能高、成本低的运维及分析平台,满足基础系统运维和业务运维等游戏运维场景需求,同时提供日志数据分析能力,实现故障预警、提高问题排查速度、提高风险识别安全等级等能力,保障游戏业务安全稳定运行。
对象存储OSS.Prometheus监控服务.支持移动端、Web 等40多种终端方式,兼容 Ogstash、Prometheus、Open Telemetry、Skywalking、Telegraf、Kafka 等数据接入,数据接入终端灵活自由、数据源统一采集(ETL)语言,与开源流计算,离线计算平台天然对接.统一数据管道.支持可观测数据统一接入,亿级数据秒级分析能力,PB 级/日...
来自: 解决方案
基于SLS实现统一告警最佳实践
基于SLS实现统一告警最佳实践
告警对于企业的开发运维,安全运维,业务运维有着至关重要的作用。然而很多企业在告警运维方面存在着重复建设、监控质量差、告警风暴、触达不人性化、无法闭环等问题。 针对企业在告警管理方面存在的痛点问题,SLS告警提供了一站式云上告警管理方案,具有弹性易用、稳定可靠、功能持续升级、成本更低、噪音更少等优势。企业可以将现有的监控方案系统无缝接入到SLS告警平台,实现在SLS上一站式管理告警。
名词解释 云服务器 ECS:云服务器 ECS(Elastic Compute Service)是阿里云提供的性能 卓越、稳定可靠、弹性扩展的 IaaS(Infrastructure as a Service)级别云计算 。云服务器 ECS免去了您采购 IT硬件的前期准备,让您像使用水、电、天然气 等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即和弹性伸缩。...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,弹性公网IP,日志服务(SLS),云速搭CADT
阿里云最佳实践容器workshop
阿里云最佳实践容器workshop
通过本篇最佳实践,可以熟悉容器及k8s的基本操作。基于eci的高弹性架构,能有效的应对业务流量洪峰,同时提升资源使用效率。
文档版本:20220301(发布日期)42 阿里云ACK容器服务workshop 阿里云 ACK实践 3.4.Prometheus监控 3.4.1.接入 Promethus 步骤1 安装 Prometheus监控插件。步骤2 稍等几分钟,可以看到监控页面:3.4.2.查看应用监控详情 选择 nginx-demo应用,观察监控详情:文档版本:20220301(发布日期)43 阿里云ACK容器服务workshop ...
来自: 最佳实践 | 相关产品:容器服务 ACK,日志服务(SLS),访问控制,容器镜像服务 ACR,云效,云速搭
容器服务 Kubernetes 版 ACK
阿里云容器服务Kubernetes版ACK(容器服务Kubernetes版,简称ACK)支持企业级K8s容器化应用的全生命周期管理,提供高性能可伸缩的容器应用管理能力,助力企业高效运行云端K8s容器化应用。
—— 餐道架构负责人蔡金辉“小鹏基于托管在容器服务 ACK 上的全量业务,采用 ARMS Prometheus 服务、前端监控和 APM 等工具实现全链路监控系统,有效洞察业务稳定性风险,保障业务稳定性。—— 小鹏技术负责人“在切换到 Kubernetes 正式环境后,扩容时间只需要约 90 秒。服务器扩容成本降低了 70%~90%。同时,部署效率...
来自: 云产品
云上成本优化workshop
云上成本优化workshop
某金融科技公司,它主要提供信贷,理财,电商等 服务,目前已经拥有千万级注册用户。该公司在将 在线业务系统和大数据业务从自建 IDC 机房迁移 到阿里云后,今年大数据集群经历过多次因为资 源不足导致弹性扩容失败的故障,运维负责人非 常苦恼。由于该公司从事互联网金融的借贷业务, 白天的催收非常依赖晚上大数据计算的结果,若 因为资源不足导致计算结果失败则意味着白天催 收业务员无事可做,会对公司业务造成严重影响。 后来,通过阿里云解决方案架构师建议的方案,将 大数据集群迁移到资源较充足的可用区以及配置 弹性伸缩多规格 ECS 选型增加交付成功率等方 法,目前已阶段性的解决因资源不足导致弹性扩 容失败的问题,但该方案在 Spot 计算资源不足 时,启用大量按量收费算力,带来了较高的成本, 并且抢占式实例和按量付费实例都不保证资源 100%交付,还是存在交付失败的可能性,特别是 在双 11 期间由于其他客户的资源需求上升带来 的资源挤兑客观上存在,就进一步增加了弹性扩 容失败的风险,从而影响业务正常运行。
持续监控 资 源 数 据 接 入 Prometheus,产 品 详 情 页:https://www.aliyun.com/product/developerservices/prometheus 以前期规划好的 tag体系进行分摊(具体根据实际业务来定,包括公共服务部分)监控数据包括:计算资源 CPU&Memory 利用率 存储资源 CPU&Memory&Iops 利用率等 以消费账单与监控看版结合,基于...
来自: 最佳实践 | 相关产品:云服务器ECS,负载均衡 SLB,弹性公网IP,容器服务 ACK,日志服务(SLS),NAT网关,函数计算,E-MapReduce,云数据库PolarDB,弹性容器实例 ECI,存储容量单位包,预留实例券,Hologres
注册配置中心
注册配置相比开源版,Nacos 和 Zookeeper 商业版具有更强的性能和 SLA 保障,并提供了丰富完善的监控报警、简单易用的控制台运维操作。
我们基于 ACK+MSE+ARMS+Prometheus 支撑了在线业务百万级并发大流量,并帮助业务迭代效率提升2倍,因应用变更导致的生产事故也降低了70%.相比自建 API 网关,MSE 云原生网关为我们提供了统一的微服务路由、流控、安全管理等能力,方便内外部多系统间的集成,在开发运维效率、性能、安全性上表现更加优异.我们未修改任何代码...
来自: 云产品
日志服务sls
日志服务(Log Service,简称Log)是针对实时数据一站式服务,在阿里集团经历大量大数据场景锤炼而成。无需开发就能快捷完成数据采集、消费、投递以及查询分析等功能,帮助提升运维、运营效率,建立DT时代海量日志处理能力。
手把手进阶学习日志服务.SLS 开箱即的日志应用.日志服务 SLS 助力企业 SecOps 云上安全审计.查看全部日志.例如游戏行业相关业务,其具备用户规模大增长快,且用户群体全球化涵盖海内外的特点。因此需要有一个稳定,弹性,且高性能的日志平台来满足游戏运营团队随着业务发展不断丰富细化的数据分析需求,以实现业务的精细...
来自: 云产品
云消息队列 RabbitMQ 版
云消息队列 RabbitMQ 版是阿里云打造的云消息服务,广泛用于海量队列分发、分布式定时任务等场景。支持 AMQP 协议,开箱即用,轻松实现快速上云,更专业、更可靠、更安全。
查看 RabbitMQ 产品概述.RabbitMQ 快速上手.查看产品计费,更好选型.查看 RabbitMQ 常见问题.阿里巴巴官方指定消息产品,成熟、稳定、先进的技术体系打造金融级消息服务,感受双十一产品的完美体验....\ 3.8.0以上版本通过 Prometheus 搭建监控告警,但没有细粒度的指标维度、无法精确监控告警.开源 RabbitMQ.
来自: 云产品
基于日志服务构建业务可观测性系统
基于日志<em>服务</em>构建业务可观测性系统
现在已知的各种监控数据的工具,以及对应的监控系统有非常多的选择,比如ZABBIX,Prometheus,Skywalking等。但是这些系统都存在同样的一个问题,只覆盖了可观察性的一部分,举个简单的类比,大家在日常开车的过程中,会用到很多的辅助设备,仪表盘,行车记录仪,导航,倒车影像等等,这些设备都各自承载了一部分的功能,但是都存在着如下的问题: l 数据覆盖不完整 l 存在数据孤岛(无法关联协同) l 使用门槛高,不够人性化 核心价值 l 全覆盖,统一协议,支持各类平台。 l 数据关联,统一Schema,关联Metrics/Logs。 l 云原生,SaaS服务,拥抱云原生。 l 简单易用,自动化埋点,数十项易用功能。 智能化,异常诊断,根因分析。
基于日志服务构建业务可观察性系统 部署架构 场景描述 现在已知的各种监控数据的工具,以及对应的 系统有非常多的选择,比如 ZABBIX,Prometheus,Skywalking等。但是这些系统都存 在同样的一个问题,只覆盖了可观察性的一部分,举个简单的类比,大家在日常开车的过程中,会 到很多的辅助设备,仪表盘,行车记录仪,...
来自: 最佳实践 | 相关产品:云服务器ECS,容器服务 ACK,日志服务(SLS)
< 1 2 3 4 5 >
共有5页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用