分布式hadoop搭建

_相关内容

搭建Hadoop环境

Hadoop是由Apache基金会使用Java语言开发的分布式开源软件框架,本文介绍如何在Linux操作系统的ECS实例上快速搭建Hadoop分布式和伪分布式环境。背景信息 Apache Hadoop软件库是一个框架,它允许通过简单的编程模型在由多台计算机组成的集群...

组件操作

组件类型 组件名称 组件说明 常用文档 自研 OSS-HDFS OSS-HDFS 是一种兼容 Hadoop 分布式文件系统接口的对象存储解决方案,支持大数据计算任务通过标准HDFS协议直接访问阿里云 OSS的数据。OSS/OSS-HDFS概述 OSS/OSS-HDFS快速入门 访问OSS...

快速入门

部署成功后,您就可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。前提条件 已开通 文件存储 HDFS 版 服务。具体操作,请参见 开通文件存储HDFS版服务。已购买ECS实例。更多信息,请参见 选购ECS...

什么是文件存储 HDFS 版

产品概述 文件存储 HDFS 版 允许您就像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等...

文件存储HDFS版

您可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中管理和访问数据那样使用文件存储HDFS版。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布...

HDFS

HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...

功能特性

无缝集成 文件存储 HDFS 版 允许您就像在Hadoop分布式文件系统(HDFS)中一样管理和访问数据。文件存储 HDFS 版 SDK可在所有Apache Hadoop 2.x环境中使用,包括阿里云EMR和阿里云Flink。文件存储 HDFS 版 支持的原生文件系统语义被开发人员...

连接指南

HDFS Shell是Hadoop分布式文件系统(HDFS)提供的命令行工具。LindormDFS(Lindorm底层存储,LDFS)100%兼容HDFS协议,您可以通过HDFS Shell工具交互式管理LDFS中存储的文件,例如文件查询、文件删除、文件权限管理和修改文件名称等。本文...

大数据型(d系列)

大数据型实例规格族旨在解决大数据时代下海量业务数据的云上计算和存储难题,适用于Hadoop分布式计算、海量日志处理和大型数据仓库等需要海量数据存储和离线计算的业务场景,充分满足以Hadoop为代表的分布式计算业务对实例存储性能、容量和...

从单体到云平台到金融级混合云

至此,蚂蚁整体的金融分布式架构框架搭建完毕。第四阶段:云平台 蚂蚁的技术架构在第四阶段的时候演变成为云平台架构,而且为了应对互联网业务形态下突发性业务对资源的弹性需求,蚂蚁也在同一阶段将架构直接进化成弹性混合云架构。第五...

文件存储HDFS版

文件存储 HDFS 版(Apsara File ...适用于互联网行业、金融行业等有大数据计算与存储分析需求的行业客户,进行海量数据存储和离线计算的业务场景,充分满足以Hadoop为代表的分布式计算业务类型对分布式存储性能、容量和可靠性的多方面要求。

Hadoop DistCp介绍

Hadoop DistCp(分布式复制)是一个用于大型集群间或集群内数据复制的工具,通过MapReduce实现复制过程中数据的分发、错误处理、恢复及报告。本文为您介绍Hadoop DistCp与Jindo DistCp的区别、Hadoop DistCp使用方法以及常见问题。说明 ...

分布式任务调度

SchedulerX是阿里巴巴自研的基于Akka架构的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob、K8s Job、Spring Schedule,支持Cron定时、一次性任务、任务编排、分布式数据处理,具备高可用、可视化、可运维、低延时等能力。

概述

分布式事务 DTX(Distributed Transaction-eXtended)是蚂蚁集团自主研发的金融级分布式事务中间件,用来保障在大规模分布式环境下业务活动的最终一致性。在蚂蚁集团内部被广泛地应用于交易、转账、红包等核心资金链路,服务于亿级用户的...

基础术语

发起方 initiator 分布式事务的发起方负责启动分布式事务,通过调用参与者的服务,将参与者纳入到分布式事务当中,并决定整个分布式事务是提交还是回滚。一个分布式事务有且只能有一个发起方。参与者 participant 参与者提供分支事务服务。...

中间件产品总览

提供丰富的服务治理功能 消息队列 基于 Apache RocketMQ 构建的分布式消息中间件 提供高可用消息云服务 任务调度 提供分布式任务调度框架 提供自动化任务调度服务 分布式事务 金融级分布式事务中间件 支持跨数据库、跨服务以及混合分布式...

功能特性

分布式事务(Distributed Transaction-eXtended,简称 DTX)是蚂蚁集团自主研发的金融级分布式事务中间件,支持跨数据库、跨服务以及混合的方式处理分布式应用,具备多种接入模式和金融级配套功能,本文将主要介绍分布式事务的功能特性。...

开通SchedulerX

背景信息 阿里云分布式任务调度SchedulerX已于2021年09月01日正式商业化。操作步骤 登录 分布式任务调度平台。首次使用并登录分布式任务调度平台,在弹出的对话框中单击 开通。在 分布式任务管理 页面,单击 立即购买。在 确认订单 页面 ...

开通服务

本节介绍如何开通分布式事务服务。前提条件 已注册阿里云账号,并完成实名认证。操作步骤 开通 SOFAStack 产品服务。使用阿里云账号登录 阿里云官网。在上方菜单栏选择 产品与服务 中间件 金融分布式架构 SOFAStack。在 SOFAStack 产品主页...

应用场景

分布式事务可应用在多个涉及数据库操作的领域,尤其在金融领域可以做到全场景的覆盖与落地验证,包括:支付与转账、账务:对于吞吐量有很高的要求 金融与理财:往往涉及的金额较大,所以对于产品的稳定性要求非常高 保险与监管报送:参与方...

什么是分布式事务

分布式事务是保障金融级分布式系统数据一致性的核心技术。本文系统阐述了其核心概念、功能特性、产品优势及应用场景,为构建高可靠、高一致的分布式业务系统奠定基础。

什么是分布式任务调度SchedulerX

分布式任务调度SchedulerX是阿里巴巴基于Akka架构自研的新一代分布式任务调度平台,提供定时调度、调度任务编排和分布式批量处理等功能。您可以在控制台配置、管理您的定时调度任务、查询任务执行记录和运行日志,还可以通过工作流进行任务...

开通SchedulerX

背景信息 阿里云分布式任务调度SchedulerX已于2021年09月01日正式商业化。操作步骤 首次使用并登录分布式任务调度平台,在弹出的对话框中单击 开通。在 分布式任务管理 页面,单击 立即购买。在 确认订单 页面 服务协议 区域,选中 我已...

概述

SOFAStack 提供了一套用于快速构建金融级分布式架构的中间件,是在严苛的金融场景里锤炼出来的最佳实践。要使用 SOFA 中间件,例如微服务或消息队列,推荐使用 SOFABoot 框架进行开发。SOFABoot SOFABoot 是蚂蚁科技基于 Spring Boot 自研...

金融分布式架构

SOFAStack 包含构建金融级云原生架构所需的各个组件,提供微服务应用开发部署、监控运维、项目管理、容灾高可用等全栈式解决方案,助力各类应用轻松转型分布式云原生架构。

什么是分布式任务调度SchedulerX

分布式任务调度SchedulerX是阿里巴巴自研的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob、Spring Schedule,K8s Job,支持Cron定时、一次性任务、可视化工作流任务编排和分布式跑批,具有高可用、可观测、可运维和低延时等能力。...

产品优势

微服务产品在蚂蚁集团内部已支撑数万个节点规模的分布式应用架构,具有高可用性、高可扩展性、高性能、高时效性、稳定可靠等核心优势,并提供丰富的功能来帮助用户简化分布式系统的管理,让业务开发人员可以专注于业务逻辑实现,提升研发...

产品优势

分布式中间件 蚂蚁分布式中间件的产品发展路径,一直秉承引领和拥抱业界先进标准和实践,同时亦能满足传统金融架构的平滑迁移、融合适配,以稳妥应对业务升级变更,并积极应对金融交易系统所面临的服务和数据扩展性、事务一致性、秒级容灾...

企业级分布式应用服务

企业级分布式应用服务EDAS(Enterprise Distributed Application Service)是一个应用托管和微服务管理的PaaS平台,提供应用开发、部署、监控、运维等全栈式解决方案,支持Spring Cloud、Dubbo等微服务运行环境,助力您的应用轻松上云。

分布式数字身份

蚂蚁区块链分布式身份服务 DIS(Decentralized Identity Service),是一种基于区块链的身份管理方案,提供实体身份的创建、验证和管理等一整套功能,实现更规范化地管理和保护实体数据,同时保证信息流转的真实性和效率,解决了跨机构的...

组件中心

中间件 分布式链路跟踪 一款实时监控并管理企业应用性能和故障的云服务,其提供数字化性能管理解决方案,帮助企业在分布式架构下快速发现并准确定位应用全生命周期的性能问题。任务调度 提供分布式任务调度框架,实现任务的分布式处理,并...

依赖与配置项

分布式事务不仅支持 SOFABoot 框架,也支持纯 Spring 的应用场景。本文将分别介绍针对不同的服务框架所要预先完成的依赖与配置项操作。无论是事务发起方还是参与者均需要完成本文的依赖与配置项操作。环境要求 必须使用 JDK 1.7 或以上版本...

分布式任务调度平台(SchedulerX)服务等级协议

本文介绍分布式任务调度平台(SchedulerX)的服务等级协议。关于服务等级协议,请参见 分布式任务调度平台(SchedulerX)服务等级协议。

分布式任务调度平台(SchedulerX)服务等级协议

本文介绍分布式任务调度平台(SchedulerX)的服务等级协议。关于服务等级协议,请参见 分布式任务调度平台(SchedulerX)服务等级协议。

互联网金融中台解决方案

方案架构 基于蚂蚁集团中台战略及架构的最佳实践,将企业级公共能力进行抽象,形成以客户服务、运营服务、分布式金融核心套件为基础的业务中台体系,实现开放、可扩展、组件化、分布式的业务架构,支持业务快速、高效、低成本创新,满足...

SOFAStack 总体介绍

SOFAStack(Scalable Open Financialarchitecture Stack)是一套用于构建金融级云原生分布式应用的技术栈。由 分布式中间件(狭义中间件)、运维管理(aPaas)、高阶运维保障 三大部分组成,并能与流行的 Dubbo、Spring Cloud 等开源微服务...

什么是分布式链路跟踪

分布式链路跟踪是构建金融级分布式架构的关键组件,本文系统阐述了其核心定义、产品架构、功能特性与典型应用场景,助您全面洞察系统调用链路,保障复杂业务的持续稳定。

常见问题

本文主要介绍在操作分布式事务过程中的常见问题。SOFAStack 是否可以部署在虚拟机、物理机上?可以,SOFAStack 部署支持物理机、虚机机 VM。SOFAStack 当前是否只支持阿里云飞天 ACK?SOFAStack 部署支持多云异构、目前支持华为云、开源 ...

金融云分布式任务调度平台(SchedulerX)服务等级协议

本文介绍金融云分布式任务调度平台(SchedulerX)的服务等级协议。关于服务等级协议,请参见 金融云分布式任务调度平台(SchedulerX)服务等级协议。

什么是蚂蚁链分布式身份服务 DIS

蚂蚁链分布式身份服务 DIS(Decentralized Identity Service),是一种基于区块链的身份管理方案,提供实体身份的创建、验证和管理等一整套功能,实现更规范化地管理和保护实体数据,同时保证信息流转的真实性和效率,解决了跨机构的身份...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用