应用实时监控服务ARMS
作为云原生可观测平台,应用实时监控服务 ARMS 包含前端监控、应用监控、云拨测等模块。覆盖浏览器、小程序、APP、分布式应用、容器等不同可观测环境与场景。帮助企业实现全栈性能监控与端到端追踪诊断。提高监控效率,压降运维工作量。
应用实时监控服务 ARMS.统一监控大盘.针对多告警源进行统一管理,实现跨平台、跨团队的应急协同.丰富的预置集成组件,覆盖阿里云日志服务SLS、Prometheus、ARMS、开源主流监控系统。支持短信、电话、钉钉、邮件、飞信等多种通知方式,同时也支持对接 Aone/Jira/PageDuty 等多种协同系统.告警源&通知集成.支持多种告警策略,...
来自: 云产品
基于SLS实现统一告警最佳实践
基于SLS实现统一告警最佳实践
告警对于企业的开发运维,安全运维,业务运维有着至关重要的作用。然而很多企业在告警运维方面存在着重复建设、监控质量差、告警风暴、触达不人性化、无法闭环等问题。 针对企业在告警管理方面存在的痛点问题,SLS告警提供了一站式云上告警管理方案,具有弹性易用、稳定可靠、功能持续升级、成本更低、噪音更少等优势。企业可以将现有的监控方案系统无缝接入到SLS告警平台,实现在SLS上一站式管理告警。
cd/usr/local/prometheus vim prometheus.yml 步骤3 在 Prometheus配置文件中,替换原有的 alertmanagers配置,即配置完成。Alertmanager configuration alerting:alertmanagers:path_prefix:/event/webhook/RAMAK_{ACCESS_KEY_ID}/{WEBHOOK_APP_ID} api_version:v2 static_configs:targets:{ALIYUN_SLS_ENDPOINT} 说明:➢...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,弹性公网IP,日志服务(SLS),云速搭CADT
容器多云统一监控日志
容器多云统一<em>监控</em>日志
多云、混合云成为常态,Forrester 报告中指出,未来 89% 的企业至少使用两个云,74% 的企业至少使用三个甚至更多公有云,在面对多云/混合云这样大的趋势下,Gartner报告指出,安全、运维复杂性、财务复杂性是多云架构的主要挑战,本方案给出了在多云/混合云场景下,构建基于容器环境下的统一管理、统一监控和统一日志方案,解决多云、混合云场景下,运维复杂性问题。 应用场景 客户在阿里云以外的其他云服务商(AWS、Azure、GCP、TencentCloud、HuaweiCloud等)或者IDC基于容器(Kubernetes)运行业务系统,希望构建容器场景下的统一监控日志系统,方便做不同大屏和问题分析定位。 解决问题 •构建容器多云统一监控和日志系统,在一个平台可以看到不同环境系统的运行情况。
开通的云产品:日志服务SLS、应用实时监控ARMS、Prometheus监控 2.创建容器服务ACK托管版集群 3.创建容器服务ACKOne注册集群 4.创建分布式容器舰队 5.创建VPC对等连接 华东2(上海):模拟客户非阿里云部署业务,各个环境资源如下 1.云服务器ECS:用于部署单节点Kubernetes,模拟非阿里云自建容器集群 产品介绍  专有网络...
来自: 最佳实践 | 相关产品:专有网络 VPC,容器服务 ACK,日志服务(SLS),应用实时监控服务 ARMS ,微服务引擎
基于SpringCloud应用玩转MSE实践
基于SpringCloud应用玩转MSE实践
随着业务不断创新,大型的单个应用和服务会被拆分为数个甚至数十个微服务,微服务架构已经被广泛应用。 微服务的好处在于快速迭代,如何在迭代过程中保障线上流量不受损。依赖开源产品缺少无运维工具,常常需要投入较大的运维人力和成本。 本实践提供基于云原生应用产品提供微服务注册配置中心、微服务治理和云原生网关等一系列高性能和高可用的企业级云服务能力。
5.1.ACK集群部署应用 步骤1登录ACK集群,新建命名空间project-qa(如果修改了命名空间名称,需要对应修改后续yaml 的namespace参数)文档版本:20240229基于SpringCloud玩转MSE 步骤2:在命名空间中,通过YAML分别创建4个应用:基线版应用:mseconsumer、mseprovider 灰度版应用:mseconsumer-gray、mseprovider-gray ...
来自: 最佳实践 | 相关产品:弹性公网IP,容器服务 ACK,日志服务(SLS),NAT网关,微服务引擎,消息队列 RocketMQ 版,云速搭
基于MSE和SAE的微服务部署与压测
基于MSE和SAE的微服务部署与压测
通过云原生微服务引擎MSE、SAE、PTS、ARMS产品,为spring cloud微服务应用提供部署和测试能力,提供一个经典微服务应用上云的典型架构,实现微服务应用的快速落地。
2.2 引擎规格 1核2G 集群节点数 3 网络类型 专有网络 公网带宽 0 实例监控 可观测监控Prometheus版 节点 属性 配置 说明 开通产品 应用实时监控服务 arms 默认 服务规格 试用版 节点 属性 配置 说明 实例名 PTS压测包 商品类型 按量抵扣资源包 资源包类型 基础版 PTS压测包 最高虚拟用户(VU)5万 VUM 3万 购买时长 预付费/按...
来自: 最佳实践 | 相关产品:负载均衡 SLB,弹性公网IP,性能测试 PTS,应用实时监控服务 ARMS ,Serverless 应用引擎,微服务引擎,云速搭
容器计算服务 ACS
容器计算服务 ACS 是以 K8s 为使用界面供给容器算力资源的云计算服务,提供符合容器规范的算力资源。
查看更多探索 ACS 更丰富的产品能力入门与试用快速上手01创建集群1配置集群网络、存储、安全等参数2配置服务发现、网关、监控、日志等功能02按需弹性使用1选择实例类型2上传应用镜像,配置实例规格03创建资源预留(可选)1选择实例类型、配置预留方式2配置资源规格,选择资源释放方式云栖·畅聊开发者如何看待阿里云发布的...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
可观测监控 Prometheus 版基于开源 Prometheus 构建的一款高效稳定低成本的监控服务,可提供完全兼容开源生态的各种应用组件监控。可观测可视化 Grafana 版免费试用作为云原生数据可视化与告警工具,可观测可视化 Grafana 版支持多种数据源接入,提供丰富的图表类型和自定义选项,以及强大灵活的的告警能力,为运维监控、...
来自: 云产品
大数据近实时数据投递MaxCompute
大数据近实时数据投递MaxCompute
本文介绍离线大数据场景使MaxCompute构建云 上近实时数仓,打通云下数据上云链路,解决数据复杂类型支持和动态分区问题,满足高级数据处理需求的最佳实践。 l混合云环境下,现有业务系统零改造,打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程,数据自动入仓。 l借助MaxCompute优化计算引擎,实现降本增效。 产品列表 云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute
进入 topic message 文档版本:20240419 55 大数据近实时数据投递 MaxCompute 在 Topic的 Prometheus监控中可以看到消息从 EMR Kafka 到 云消息队列 Kafka 的延迟情况。kafka同步数据至 MaxCompute状态。进入 Dataworks的集成页面,可以查看同步 任务的延迟情况 文档版本:20240419 56 大数据近实时数据投递 MaxCompute ...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,云服务器ECS,访问控制,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,数据总线,云速搭CADT
微服务应用问题定位及故障演练
微服务应用问题定位及故障演练
场景描述 用户微服务架构应用基于阿里云 ACK 部署, 通 过 ARMS 监控发现微服务应用的容错能力是否 健壮, 容器编排配置是否合理, 以及节点故障引 发的问题等, 方案通过 AHAS 故障注入模拟生 产环境产生的故障, 通过 ARMS 及时发现问题、 定位问题, 并结合 ARMS 的告警功能快速发现 并解决问题。  发现调用下游一个服务实例出现异常。  发现业务 Pod 故障, 验证业务的稳定性。  发现调用数据库延迟故障, 验证 Pod 的水 平扩容能力。 解决问题 1. 定位并解决微服务应用的容错能力。 2. 定位并解决微服务应用编排合理性。 3. 发现故障并验证系统故障的告警时效性。 产品列表  应用高可用服务 AHAS  性能测试 PTS  应用实时监控服务 ARMS  容器服务 kubernetes 版  负载均衡 SLB  专有网络 VPC  日志服务 SLS
产品列表 最佳实践频道 阿里云最佳实践分享群 应用高可用服务 AHAS 性能测试 PTS 应用实时监控服务 ARMS 容器服务 kubernetes版 负载均衡 SLB 专有网络 VPC 日志服务 SLS 云速搭 CADT 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 云上运维实践 微服务应用问题定位及故障演练 文档版本:20220331 ...
来自: 最佳实践 | 相关产品:容器服务 ACK,日志服务(SLS),性能测试 PTS,应用实时监控服务 ARMS ,应用高可用服务 AHAS,云速搭
基于日志服务构建业务可观测性系统
基于日志<em>服务</em>构建业务可观测性系统
现在已知的各种监控数据的工具,以及对应的监控系统有非常多的选择,比如ZABBIX,Prometheus,Skywalking等。但是这些系统都存在同样的一个问题,只覆盖了可观察性的一部分,举个简单的类比,大家在日常开车的过程中,会用到很多的辅助设备,仪表盘,行车记录仪,导航,倒车影像等等,这些设备都各自承载了一部分的功能,但是都存在着如下的问题: l 数据覆盖不完整 l 存在数据孤岛(无法关联协同) l 使用门槛高,不够人性化 核心价值 l 全覆盖,统一协议,支持各类平台。 l 数据关联,统一Schema,关联Metrics/Logs。 l 云原生,SaaS服务,拥抱云原生。 l 简单易用,自动化埋点,数十项易用功能。 智能化,异常诊断,根因分析。
基于日志服务构建业务可观察性系统 部署架构 场景描述 现在已知的各种监控数据的工具,以及对应的监 控系统有非常多的选择,比如 ZABBIX,Prometheus,Skywalking等。但是这些系统都存 在同样的一个问题,只覆盖了可观察性的一部分,举个简单的类比,大家在日常开车的过程中,会用 到很多的辅助设备,仪表盘,行车记录仪,...
来自: 最佳实践 | 相关产品:云服务器ECS,容器服务 ACK,日志服务(SLS)
监控
云监控(CloudMonitor)是阿里云提供的一款一站式、全链路、开箱即用的监控产品。涵盖云上云下统一的主机监控、百余款的云产品监控、覆盖全球的网络监控、面向应用和业务的日志监控和自定义监控,提供丰富的指标数据和强大开放的平台能力,帮助客户第一时间发现和定位问题构建完善的监控运维体系。
更多产品与服务.更多产品与服务.函数计算(Function Compute)是一个事件驱动的全托管 Serverless 计算服务,您无需管理服务器等基础设施,只需编写代码并上传,函数计算会为您准备好计算资源,并以弹性、可靠的方式运行您的代码....云监控提供全方位智能化高效的监控服务,助您提升服务稳定性,降低运维成本.查看全部日志.
来自: 云产品
云基础产品与基础设施
云基础产品与基础设施作为阿里云产品六大版块之一,主要包含弹性计算、存储、网络、安全、云原生应用平台以及无影和基础设施类产品,向客户提供高度自动化的标准化产品对网络功能、计算机(虚拟或专用硬件)和数据存储空间进行访问,同时支持灵活扩展,可以直接使用自助服务界面。
容器服务 ACK 发行版.Prometheus 监控服务.Grafana 服务.事件总线 EventBridge.云服务总线 CSB.云原生应用交付平台 ADP.Serverless 工作流.服务网格 ASM.应用配置管理 ACM.云原生应用平台.API 网关.运维事件中心.智能顾问 Advisor.云治理中心.云迁移中心.服务器迁移中心 SMC.智能计算灵骏.云解析 PrivateZone.云解析 DNS....
来自: 云产品
容器服务 Kubernetes 版 ACK
阿里云容器服务Kubernetes版ACK(容器服务Kubernetes版,简称ACK)支持企业级K8s容器化应用的全生命周期管理,提供高性能可伸缩的容器应用管理能力,助力企业高效运行云端K8s容器化应用。
—— 餐道架构负责人蔡金辉“小鹏基于托管在容器服务 ACK 上的全量业务,采用 ARMS Prometheus 服务、前端监控和 APM 等工具实现全链路监控系统,有效洞察业务稳定性风险,保障业务稳定性。—— 小鹏技术负责人“在切换到 Kubernetes 正式环境后,扩容时间只需要约 90 秒。服务器扩容成本降低了 70%~90%。同时,部署效率...
来自: 云产品
云原生
阿里云拥有丰富的云原生产品家族,全面的云原生开源贡献,大规模的云原生应用实践,以及广泛的云原生客户群体,为企业数字创新提供全方位能力支撑。
提供完全兼容开源生态的各种应用组件监控,提供开箱即用的监控大盘和告警,阿里云提供全托管服务.Prometheus 监控服务.数据可视化平台Grafana服务全托管免运维,默认集成数据库RDS、消息队列MQ、实时计算Elasticsearch、Prometheus监控、日志服务SLS等数据源,并提供丰富数据看板模板,让数据可视化更加高效、精细.Grafana ...
来自: 云产品
Dubbo应用上云
Dubbo应用上云
场景描述 本最佳实践适用于企业自建 Dubbo 应用上云, 应 用采用 docker 方式部署, 降低部署成本。同时利 用 MSE 提供 Zookeeper 服务注册管理。 通过阿 里云的 ARMS 和 AHAS 服务提供应用监控和服务 限流管理,简化运维并提供服务的全生命周期管 理。 解决问题 1. 自建 dubbo 应用迁移上阿里云。 2. 应用部署在容器内降低成本。 3. 通过 MSE 提供 ZK 服务,提高稳定性。 4. 通过 ARMS/AHAS 提供监控和服务限流能力 产品列表 容器服务 Kubernetes 版(ACK) 微服务引擎(MSE) 关系数据库服务(RDS) 应用高可用服务(AHAS) 应用实时监控服务(ARMS)
4.通过 ARMS/AHAS提供监控和服务限流能力 产品列表 最佳实践频道 阿里云最佳实践分享群 容器服务 Kubernetes版 ACK 微服务引擎 MSE 关系数据库服务 RDS 应用高可用服务 AHAS 应用实时监控服务 ARMS 云速搭 CADT 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 Dubbo应用上云 最佳实践 文档版本:...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,容器服务 ACK,应用实时监控服务 ARMS ,应用高可用服务 AHAS,微服务引擎,云速搭
基于弹性计算的AI推理
基于弹性计算的AI推理
场景描述 本方案适用于使用GPU进行AI在线推理的场 景。在推理之前,模型已经训练完成。例如,刷脸 支付中,我们在刷脸的时候,就是推理的一个过 程。再比如图像分类,目标检测,语音识别,语 义分析等返回结果的过程。 解决问题 使用GPU云服务器搭建推理环境 使用容器服务Kubernetes版构建推理 环境 使用NAS存储模型数据 使用飞天AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务Kubernetes版 NAS共享存储
配置文件名固定为 model.config,每个模型需要一个配置文件,其内容如下所示:参数描述见下表。名称 描述 name 模型的名称。platform 模型的类型,可选值:tensorflow_frozenmodel tensorflow_savedmodel pytorch_model caffe2_model max_batch_size 允许处理的最大 batchsize数目,根据实际需求自定义。input 模型输入节点...
来自: 最佳实践 | 相关产品:云服务器ECS,文件存储NAS,容器服务 ACK
阿里云最佳实践容器workshop
阿里云最佳实践容器workshop
通过本篇最佳实践,可以熟悉容器及k8s的基本操作。基于eci的高弹性架构,能有效的应对业务流量洪峰,同时提升资源使用效率。
文档版本:20220301(发布日期)42 阿里云ACK容器服务workshop 阿里云 ACK实践 3.4.Prometheus监控 3.4.1.接入 Promethus 步骤1 安装 Prometheus监控插件。步骤2 稍等几分钟,可以看到监控页面:3.4.2.查看应用监控详情 选择 nginx-demo应用,观察监控详情:文档版本:20220301(发布日期)43 阿里云ACK容器服务workshop ...
来自: 最佳实践 | 相关产品:容器服务 ACK,日志服务(SLS),访问控制,容器镜像服务 ACR,云效,云速搭
Spark on ECI大数据分析
Spark on ECI大数据分析
场景描述 方案优势 1.计算引擎弹性扩缩容,兼顾资源弹性与计 算资源成本优化。 2.计算与存储分离架构,结合阿里云原生云 存储产品,海量数据湖优势。 3.Kubernetes原生的调度性能优势,提升在 大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。 解决问题 1.计算资源弹性能力不足,计算资源成本管 控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离,大数据量分析时出 现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持 有限等缺点。 产品列表 容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR
2.关于 Hadoop的核心配置文件的说明介绍如下图所示:文档版本:20200409 5 Spark on ECI大数据分析 环境准备 3.修改 core-site.xml文件,路径位于 Hadoop目录下的/etc/hadoop/目录下。步骤5 配置环境变量。1.修改/etc/profile文件并保存。2.在配置最后加入相应路径信息。3.执行 source/etc/profile命令以便环境变量配置生效...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS
云上成本优化workshop
云上成本优化workshop
某金融科技公司,它主要提供信贷,理财,电商等 服务,目前已经拥有千万级注册用户。该公司在将 在线业务系统和大数据业务从自建 IDC 机房迁移 到阿里云后,今年大数据集群经历过多次因为资 源不足导致弹性扩容失败的故障,运维负责人非 常苦恼。由于该公司从事互联网金融的借贷业务, 白天的催收非常依赖晚上大数据计算的结果,若 因为资源不足导致计算结果失败则意味着白天催 收业务员无事可做,会对公司业务造成严重影响。 后来,通过阿里云解决方案架构师建议的方案,将 大数据集群迁移到资源较充足的可用区以及配置 弹性伸缩多规格 ECS 选型增加交付成功率等方 法,目前已阶段性的解决因资源不足导致弹性扩 容失败的问题,但该方案在 Spot 计算资源不足 时,启用大量按量收费算力,带来了较高的成本, 并且抢占式实例和按量付费实例都不保证资源 100%交付,还是存在交付失败的可能性,特别是 在双 11 期间由于其他客户的资源需求上升带来 的资源挤兑客观上存在,就进一步增加了弹性扩 容失败的风险,从而影响业务正常运行。
生产集群建议在创建集群的硬件 步骤开启高可用。如果购买时未开启高可用,在后续使用过程中无法开启高可用 功能。Master节点主要用来存储 HDFS元数据和组件 Log文件,属于计算密集 型,对磁盘 IO要求不高。本实践中,选型为 ecs.c6e.2xlarge(8c16g)X 2。Core节点选型 Core节点主要用来存储数据和执行计算,运行 ...
来自: 最佳实践 | 相关产品:云服务器ECS,负载均衡 SLB,弹性公网IP,容器服务 ACK,日志服务(SLS),NAT网关,函数计算,E-MapReduce,云数据库PolarDB,弹性容器实例 ECI,存储容量单位包,预留实例券,Hologres
基于MyBase构建自主可控数据库和高弹性应用实践
基于MyBase构建自主可控数据库和高弹性应用实践
一些企业级客户上云前,会重点关心数据库是否自主可控,包括云资源独享、自主可运维、获取OS 权限等特点,同时又要兼顾数据库合规性、安全性和高性能的要求;并力求在业务弹性下合理利用云产品降低数据和应用成本,弹性地支持业务。本实践为此类用户提供相关实践参考。
说明 V1.0 2020-03-23 阿瑟 德歌、智予、天裵 创建 联系我们 如果您在使用本最佳实践时遇到问题,欢迎通过钉钉扫描二维码联系我们获取进一步 帮助:文档版本:20210323 I 基于 MyBase构建自主可控数据库和高弹性实践 前言 前言 名词解释 云服务器 ECS:是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效 率,使您...
来自: 最佳实践 | 相关产品:负载均衡 SLB,堡垒机,弹性伸缩,云数据库专属集群MyBase,云速搭CADT
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用