分布式存储系统

_相关内容

如何保证幂等性

幂等性在分布式系统设计中具有十分重要的地位。保证幂等性 通常情况下,客户端只需要在500(InternalServerError)或503(ServiceUnavailable)错误,或者无法获取响应结果时重试。使用阿里云VPC API,您可以从客户端生成一个参数值不超过...

集群消费和广播消费

由于消费者应用一般是分布式系统,以集群方式部署,因此消息队列约定以下概念:集群:使用相同 Group ID 的消费者属于同一个集群。同一个集群下的消费者消费逻辑必须完全一致(包括 Tag 的使用)。详情请参见 订阅关系一致。集群消费:当...

如何保证幂等性

幂等性在分布式系统设计中具有十分重要的地位。保证幂等性 通常情况下,客户端只需要在500(InternalErrorInternalError)或503(ServiceUnavailable)错误,或者无法获取响应结果时重试。使用AnalyticDB PostgreSQL版API,您可以从客户端...

如何查看 SQL 性能

集群作为一个分布式系统,机器间的通信是通过 RPC 完成的,如果执行计划中 rpc_count 的值过高,意味着执行的 SQL 需要频繁的进行多机通信,才能完成该 SQL 请求。需要具体分析 SQL 需要访问的数据是否分布在多台机器上,RPC 过高一般是...

链路追踪简介

分布式系统中,请求横跨多个云服务,需要分析和诊断函数的性能瓶颈。核心功能 函数计算的链路追踪功能可以串联整个调用链,包含以下核心功能: 自动记录函数计算内部关键步骤耗时时间。更多信息,请参见自动记录函数计算内部关键步骤耗时。...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

CHAOS故障演练是阿里巴巴内部广泛使用的演练平台云上版本,具有灵活的流程编排、丰富的故障场景等特点,可以帮助企业提升分布式系统的容错能力,保障在企业上云或往云原生系统迁移过程中业务的连续性。AHAS CHAOS故障演练在ChaosBlade的...

应用防护规则适用场景

随着业务从单体架构向分布式架构演进以及部署方式的变化,服务之间的依赖关系变得越来越复杂,业务系统也面临着巨大的高可用挑战。AHAS应用防护就是一款借助流量控制、熔断降级等模块,来提高应用高可用能力的产品。本文介绍各个应用防护...

如何保证幂等性

幂等性在分布式系统设计中具有十分重要的地位。保证幂等性 通常情况下,客户端只需要在HTTP状态码返回500 Internal Server Error或503 Service Unavailable错误,或者无法获取响应结果时重试。使用ROS API,您可以从客户端生成一个参数值不...

如何保证幂等性

幂等性是在分布式系统设计中具有十分重要的地位。保证幂等性 通常情况下,客户端只需要在500(InternalError)或503(ServiceUnavailable)错误,或者无法获取响应结果时重试。使用阿里云ECS API,您可以从客户端生成一个参数值不超过64个...

AHAS 使用指引

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景实现,能够帮助分布式系统提升容错性和可恢复性。功能开关 功能开关是一个轻量级的运行时动态配置修改框架,既可用于集中管理各应用的业务开关,也...

基本概念

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景实现,能够帮助分布式系统提升容错性和可恢复性。更多名词解释如下:名词 名词解释 演练 一个完整的、可执行的流程配置。草稿 未配置完成的演练或修改...

安装Spark单机版

Java JDK(Java Development Kit):1.8.0 Hadoop(分布式系统基础架构):2.7.7 Scala(编程语言):2.12.1 Spark(计算引擎):2.1.0 使用模板创建资源栈成功后即可获取SparkWebSiteURL,登录Spark管理控制台。如需通过外网访问...

什么是应用高可用服务AHAS

流量防护工作流程 故障演练 故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景实现,能够帮助分布式系统提升容错性和可恢复性。流程故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查...

集群消费和广播消费

消费者应用一般是分布式系统,以集群方式部署。消费者在订阅Topic时,可根据实际业务选择集群消费或广播消费,集群中的多个消费者将按照实际选择的消费模式消费消息。使用相同Group ID的消费者属于同一个集群。同一个集群下的消费者消费...

安装Spark集群版

Kit):1.8.0Hadoop(分布式系统基础架构):2.7.7Scala(编程语言):2.12.1Spark(计算引擎):2.1.0使用模板创建资源栈成功后即可获取SparkWebSiteURL,登录Spark管理控制台。如需通过外网访问SparkWebSiteURL,请在安全组添加入方向...

Zabbix SSO

界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。能监视各种网络参数,保证服务器系统的安全运营。说明 注意:在 Zabbix 5.0+ 版本中,系统原生提供 SAML 2.0 的 SSO 支持。若您当前使用版本低于 5.0,可能需要额外插件...

使用ROS部署LNMP环境

Web开发测试环境或Hadoop/Spark分布式系统。本教程以ROS控制台提供的部署LNMP(Linux+Nginx+MySQL+PHP)环境模板为例,使用ROS自动创建一台ECS实例并在该实例上部署LNMP环境。更多ROS信息,请参见ROS文档和ROS云栖博客。操作步骤登录ROS管理...

使用Fluid加速Lindorm S3协议兼容的数据访问

elbencho是一个分布式存储测试工具。以下示例中使用elbencho工具来简化数据读写任务的部署流程。请确保已将Lindorm S3的数据集成功部署到Kubernetes集群的Fluid中,只需要执行简单命令便能提交数据读写任务。准备测试数据。您需要在Lindorm...

围绕混沌工程的平台实践

以下是混沌工程官方定义:混沌工程是在分布式系统上进行实验的学科,目的是建立对系统抵御生产环境中失控条件的能力以及信心。因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实...

自定义事件监控最佳实践

这些开源系统由多个复杂的分布式系统组成,自行维护面临着技术门槛高、成本高的问题。云监控提供的事件监控功能,能够很好的解决这些问题。准备工作 自定义事件监控提供了Java SDK和OpenAPI两种上报数据的方式,本文为您介绍通过Java SDK...

使用UUID-OSSP

分布式系统来说,UUID比序列更能保证唯一性。UUID由32个16进制数字组成,标准格式为一组8位字符+一组4位字符+一组4位字符+一组4位字符+12组字符,每组字符由连字符连接,示例如下:a0eebc99-9c0b-4ef8-bb6d-6bb9bd380a11UUID还支持以大写...

YARN调度器

Capacity),集群与父队列有空闲资源时,子队列可以利用其他队列的空闲(未被使用)保障资源,从而支持不同队列资源时复用,提升集群的资源利用率。ACL控制:每个队列均可以支持较为严格的权限控制,可以指定允许提交和管理任务的用户,...

蚂蚁 PaaS 平台核心领域模型介绍

层核心领域模型应用(Application)与应用服务(AppService)为了方便金融级大规模分布式系统的研发运维,蚂蚁 PaaS 平台在阿里云基础资源之上抽象了“应用(Application)”和“应用服务(AppService)” 的概念。一个租户内的一套代码...

测试指标

一般扩展能力非常好的应用系统,扩展指标应是线性或接近线性的,现在很多大规模的分布式系统的扩展能力非常好。标准 理想的扩展能力是资源增加几倍,性能就提升几倍。扩展能力至少在70%以上。可靠性指标 双机热备 对于将双机热备作为可靠性...

常见问题

将<集群名>替换为集群名称以便区分,可能有多个YARN集群对应同一分布式存储的情况。查看capacity-scheduler.xml配置。方式一(REST API):http:// ws/v1/cluster/scheduler-conf。方式二(HDFS文件):${yarn.scheduler.configuration.fs....

关键缺陷通知

MC直读时在因为系统实现缺陷,存在一定概率造成元数据与数据状态不一致,造成存储引擎无法正常加载数据,造成启动失败。后续修正问题时,有可能存在丢失删除状态的问题。出现版本:1.3.14至1.3.33版本。修复版本:1.3.34及以上版本。建议低...

Catalog概述

数据文件以不同的格式存储在分布式文件系统或对象存储系统中。当FE将生成的查询计划分发给各个BE后,各个BE会并行扫描Hive存储系统中的目标数据,并执行计算返回查询结果。查询数据查询内部数据如果需要查询存储在StarRocks中的数据,请...

扩展MapReduce(MR2)

传统的MapReduce模型要求在经过每一轮MapReduce操作后,得到的数据结果必须存储分布式文件系统中(例如,HDFS或MaxCompute数据表)。MapReduce模型通常由多个MapReduce作业组成,每个作业执行完成后都需要将数据写入磁盘,然而后续的Map...

Node Labels特性使用

Labels信息,所以必须将yarn.node-labels.fs-store.root-dir配置为分布式存储路径,例如/tmp/node-labels或者${fs.defaultFS}/tmp/node-labels(EMR Hadoop默认文件系统为分布式HDFS,详情请参见使用方式)。重要 自定义的分布式路径必须...

某电商公司本地IDC数据迁移到OSS的案例

某电商公司内部自建的IDC,使用了分布式文件系统FastDFS存储数据。数据约为300TB大小,3000万个文件。该公司已通过高速通道专线将本地IDC与深圳地域的阿里云VPC网络打通。现因公司发展需要,考虑将业务切换到OSS上。为保证公司业务正常进行...

HDFS Reader

HDFS Reader提供了读取分布式文件系统数据存储的能力。在底层实现上,HDFS Reader获取分布式文件系统上文件的数据,并转换为数据集成传输协议传递给Writer。重要 HDFS Reader仅支持使用新增和使用独享数据集成资源组。使用限制 目前不支持...

MaxCompute安全白皮书

在数据存储系统中,有三类角色,分别称为Master、Chunk Server和Client。MaxCompute用户的每一个写操作经过层层转换,最终会交由Client来执行,执行过程如下: Client计算出这个写操作对应的Chunk。Client向Master查询该Chunk的三份副本的...

云数据库 MongoDB

云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份恢复、性能优化等功能。

产品功能

跨数据库分布式事务 系统分库、分表后,跨库事务几乎无法避免,GTS 可以让应用轻松具备跨库事务处理能力。跨服务的分布式事务 提供跨库、跨服务的事务支持,实现业务链路级别的分布式事务。消息队列分布式事务 在多次调用消息系统的场景中...

概述

协议和语法,支持库分表、平滑扩容、服务升降配、透明读写分离和分布式事务等特性,具备分布式数据库全生命周期的运维管控能力。更多数据访问代理的详情,请参见 什么是数据访问代理。分布式事务SOFAStack 分布式事务是蚂蚁科技自主研发...

产品系列

产品架构多主集群(库表)的架构图如下:集群中所有的数据文件都存放在共享分布式存储(PolarStore)中,各个RW节点通过分布式文件系统(PolarFileSystem)共享底层存储(PolarStore)中的数据文件。用户可以通过集群地址访问整个集群,...

链路数据(Trace)

在广义上,一个调用链代表一个事务或者流程在(分布式系统中的执行过程。在OpenTracing标准中,调用链是多个Span组成的一个有向无环图(Directed Acyclic Graph,简称DAG),每一个Span代表调用链中被命名并计时的连续性执行片段。下图是...

产品概述

云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。更多详情请参见什么是云数据库MongoDB版。

对接Jaeger

Service借助阿里云日志服务的海量数据处理能力,让您享受Jaeger在分布式追踪领域给您带来便捷的同时无需过多关注后端存储系统的问题。Jaeger UI部分仅提供查询、展示Trace的功能,对分析问题、排查问题支持不足。使用Jaeger on Alibaba ...

基本概念

数据被采集存储后,分布式追踪系统一般会选择使用包含时间轴的时序图来呈现这个调用链。图 2.包含时间轴的链路图 OpenTracing数据模型 整体概念 OpenTracing中的调用链(Trace)通过归属于此调用链的Span来隐性地定义。一条调用链可以视为...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO

你可能感兴趣

热门推荐

新人特惠 爆款特惠 最新活动 免费试用